Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia

1. Data ya awali

Kusafisha data ni mojawapo ya changamoto zinazokabili kazi za uchambuzi wa data. Nyenzo hii ilionyesha maendeleo na ufumbuzi uliotokea kama matokeo ya kutatua tatizo la vitendo la kuchambua database katika malezi ya thamani ya cadastral. Vyanzo hapa "RIPOTI No. 01/OKS-2019 juu ya matokeo ya hesabu ya cadastral ya serikali ya aina zote za mali isiyohamishika (isipokuwa kwa mashamba ya ardhi) katika eneo la Khanty-Mansiysk Autonomous Okrug - Ugra".

Faili "Comparative model total.ods" katika "Kiambatisho B. Matokeo ya kuamua KS 5. Taarifa juu ya njia ya kuamua thamani ya cadastral 5.1 Mbinu ya kulinganisha" ilizingatiwa.

Jedwali 1. Viashirio vya takwimu vya mkusanyiko wa data katika faili "Comparative model total.ods"
Jumla ya idadi ya mashamba, pcs. - 44
Jumla ya idadi ya rekodi, pcs. - 365 490
Jumla ya idadi ya wahusika, pcs. - 101 714 693
Wastani wa idadi ya wahusika katika rekodi, pcs. - 278,297
Mkengeuko wa kawaida wa wahusika katika rekodi, pcs. - 15,510
Idadi ya chini ya herufi katika ingizo, pcs. - 198
Idadi ya juu zaidi ya herufi katika ingizo, pcs. - 363

2. Sehemu ya utangulizi. Viwango vya msingi

Wakati wa kuchambua hifadhidata iliyoainishwa, kazi iliundwa kutaja mahitaji ya kiwango cha utakaso, kwani, kama ilivyo wazi kwa kila mtu, hifadhidata iliyoainishwa inaunda athari za kisheria na kiuchumi kwa watumiaji. Wakati wa kazi, ikawa kwamba hapakuwa na mahitaji maalum ya kiwango cha kusafisha data kubwa. Kuchambua kanuni za kisheria katika suala hili, nilifikia hitimisho kwamba zote zinaundwa kutokana na uwezekano. Hiyo ni, kazi fulani imeonekana, vyanzo vya habari vinaundwa kwa kazi hiyo, kisha hifadhidata huundwa na, kwa msingi wa hifadhidata iliyoundwa, zana za kutatua shida. Suluhisho zinazotokana ni vidokezo vya kumbukumbu katika kuchagua kutoka kwa njia mbadala. Niliwasilisha hii kwenye Kielelezo 1.

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia

Kwa kuwa, katika masuala ya kuamua viwango vyovyote, ni vyema kutegemea teknolojia zilizothibitishwa, nilichagua mahitaji yaliyowekwa katika "MHRA GxP Ufafanuzi wa Uadilifu wa Data na Mwongozo kwa Sekta", kwa sababu niliona hati hii kuwa ya kina zaidi kwa suala hili. Hasa, katika hati hii sehemu inasema "Ikumbukwe kwamba mahitaji ya uadilifu wa data yanatumika sawa kwa mwongozo (karatasi) na data ya kielektroniki." (tafsiri: "...mahitaji ya uadilifu wa data yanatumika sawa kwa mwongozo (karatasi) na data ya kielektroniki"). Uundaji huu unahusishwa kabisa na dhana ya "ushahidi ulioandikwa", katika masharti ya Kifungu cha 71 cha Kanuni ya Utaratibu wa Kiraia, Sanaa. 70 CAS, Sanaa 75 APC, "kwa maandishi" Sanaa. 84 Kanuni ya Utaratibu wa Kiraia.

Kielelezo cha 2 kinatoa mchoro wa uundaji wa mbinu za aina za habari katika sheria.

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mchele. 2. Chanzo hapa.

Mchoro wa 3 unaonyesha utaratibu wa Mchoro 1, kwa kazi za "Mwongozo" ulio juu. Ni rahisi, kwa kulinganisha, kuona kwamba mbinu zinazotumiwa wakati wa kukidhi mahitaji ya uadilifu wa habari katika viwango vya kisasa vya mifumo ya habari ni mdogo sana kwa kulinganisha na dhana ya kisheria ya habari.

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mtini. 3

Katika hati maalum (Mwongozo), uunganisho kwa sehemu ya kiufundi, uwezo wa usindikaji na kuhifadhi data, imethibitishwa vizuri na quote kutoka Sura ya 18.2. Hifadhidata ya uhusiano: "Muundo huu wa faili ni salama zaidi kwa asili, kwani data inashikiliwa katika umbizo kubwa la faili ambalo huhifadhi uhusiano kati ya data na metadata."

Kwa kweli, kwa njia hii - kutoka kwa uwezo uliopo wa kiufundi, hakuna kitu kisicho cha kawaida na, yenyewe, hii ni mchakato wa asili, kwani upanuzi wa dhana hutoka kwa shughuli iliyosomwa zaidi - muundo wa hifadhidata. Lakini, kwa upande mwingine, kanuni za kisheria zinaonekana ambazo hazitoi punguzo juu ya uwezo wa kiufundi wa mifumo iliyopo, kwa mfano: GDPR - Udhibiti wa Jumla wa Ulinzi wa Data.

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mchele. 4. Funeli ya uwezo wa kiufundi (Chanzo).

Katika vipengele hivi, inakuwa wazi kwamba dataset ya awali (Mchoro 1) itabidi, kwanza kabisa, kuokolewa, na pili, kuwa msingi wa kutoa maelezo ya ziada kutoka kwake. Kweli, kama mfano: kamera za kurekodi sheria za trafiki ziko kila mahali, mifumo ya usindikaji wa habari huondoa wakiukaji, lakini habari zingine zinaweza kutolewa kwa watumiaji wengine, kwa mfano, kama ufuatiliaji wa uuzaji wa muundo wa mtiririko wa wateja kwenye kituo cha ununuzi. Na hiki ni chanzo cha thamani ya ziada wakati wa kutumia BigDat. Inawezekana kabisa kwamba hifadhidata zinazokusanywa sasa, mahali fulani katika siku zijazo, zitakuwa na thamani kulingana na utaratibu sawa na thamani ya matoleo adimu ya 1700 kwa wakati huu. Baada ya yote, kwa kweli, hifadhidata za muda ni za kipekee na haziwezekani kurudiwa katika siku zijazo.

3. Sehemu ya utangulizi. Vigezo vya tathmini

Wakati wa mchakato wa usindikaji, uainishaji ufuatao wa makosa ulitengenezwa.

1. Darasa la makosa (kulingana na GOST R 8.736-2011): a) makosa ya utaratibu; b) makosa ya nasibu; c) kosa.

2. Kwa wingi: a) upotoshaji wa mono; b) upotoshaji mwingi.

3. Kulingana na umuhimu wa matokeo: a) muhimu; b) sio muhimu.

4. Kwa chanzo cha tukio:

A) Kiufundi - makosa yanayotokea wakati wa uendeshaji wa vifaa. Hitilafu inayofaa kwa mifumo ya IoT, mifumo yenye kiwango kikubwa cha ushawishi juu ya ubora wa mawasiliano, vifaa (vifaa).

B) Makosa ya waendeshaji - makosa katika anuwai kutoka kwa typos za waendeshaji wakati wa pembejeo hadi makosa katika uainishaji wa kiufundi wa muundo wa hifadhidata.

C) Makosa ya mtumiaji - hapa kuna makosa ya watumiaji katika safu nzima kutoka "kusahau kubadilisha mpangilio" hadi kupotosha mita kwa miguu.

5. Imegawanywa katika darasa tofauti:

a) "kazi ya kitenganishi," yaani, nafasi na ":" (kwa upande wetu) wakati ilinakiliwa;
b) maneno yaliyoandikwa pamoja;
c) hakuna nafasi baada ya herufi za huduma
d) alama nyingi za ulinganifu: (), "", "...".

Ikichukuliwa pamoja, pamoja na uwekaji utaratibu wa makosa ya hifadhidata iliyowasilishwa kwenye Mchoro wa 5, mfumo wa kuratibu unaofaa unaundwa kwa ajili ya kutafuta makosa na kutengeneza algoriti ya kusafisha data kwa mfano huu.

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mchele. 5. Makosa ya kawaida yanayolingana na vitengo vya miundo ya hifadhidata (Chanzo: Oreshkov V.I., Paklin N.B. "Dhana kuu za ujumuishaji wa data").

Usahihi, Uadilifu wa Kikoa, Aina ya Data, Uthabiti, Upungufu, Ukamilifu, Rudufu, Uadilifu wa Kanuni za Biashara, Uhakika wa Muundo, Ukosefu wa Data, Uwazi, Kwa Wakati, Uzingatiaji wa Kanuni za Uadilifu wa Data. (Ukurasa wa 334. Misingi ya kuhifadhi data kwa wataalamu wa IT / Paulraj Ponniah.β€” Toleo la 2.)

Iliwasilisha maneno ya Kiingereza na tafsiri ya mashine ya Kirusi kwenye mabano.

Usahihi. Thamani iliyohifadhiwa katika mfumo kwa kipengele cha data ni thamani sahihi kwa tukio hilo la kipengele cha data. Ikiwa una jina la mteja na anwani iliyohifadhiwa kwenye rekodi, basi anwani ndiyo anwani sahihi ya mteja aliye na jina hilo. Ukipata kiasi kilichoagizwa kama uniti 1000 kwenye rekodi ya oda namba 12345678, basi kiasi hicho ni kiasi sahihi cha agizo hilo.
[Usahihi. Thamani iliyohifadhiwa katika mfumo kwa kipengele cha data ni thamani sahihi ya tukio hilo la kipengele cha data. Ikiwa una jina la mteja na anwani iliyohifadhiwa kwenye rekodi, basi anwani ndiyo anwani sahihi ya mteja aliye na jina hilo. Ukipata idadi iliyoagizwa kama vitengo 1000 kwenye rekodi ya nambari ya agizo 12345678, basi idadi hiyo ndio kiasi kamili cha agizo hilo.]

Uadilifu wa Kikoa. Thamani ya data ya sifa iko katika safu ya thamani zinazoruhusiwa, zilizobainishwa. Mfano wa kawaida ni maadili yanayoruhusiwa kuwa "mwanamume" na "mwanamke" kwa kipengele cha data ya jinsia.
[Uadilifu wa Kikoa. Thamani ya data ya sifa iko ndani ya anuwai ya thamani halali, zilizobainishwa. Mfano wa jumla ni thamani halali "mwanaume" na "mwanamke" kwa kipengele cha data ya jinsia.]

Aina ya Data. Thamani ya sifa ya data huhifadhiwa kama aina ya data iliyofafanuliwa kwa sifa hiyo. Wakati aina ya data ya sehemu ya jina la duka inafafanuliwa kama "maandishi," matukio yote ya sehemu hiyo huwa na jina la duka lililoonyeshwa katika umbizo la maandishi na si misimbo ya nambari.
[Aina ya data. Thamani ya sifa ya data huhifadhiwa kama aina ya data iliyofafanuliwa kwa sifa hiyo. Ikiwa aina ya data ya sehemu ya jina la duka inafafanuliwa kama "maandishi", matukio yote ya sehemu hii yana jina la duka linaloonyeshwa katika umbizo la maandishi badala ya misimbo ya nambari.]

Uthabiti. Muundo na maudhui ya uga wa data ni sawa katika mifumo mbalimbali ya chanzo. Ikiwa msimbo wa bidhaa wa bidhaa ABC katika mfumo mmoja ni 1234, basi msimbo wa bidhaa hii ni 1234 katika kila mfumo wa chanzo.
[Uthabiti. Muundo na maudhui ya uga wa data ni sawa katika mifumo tofauti ya chanzo. Ikiwa msimbo wa bidhaa wa bidhaa ABC kwenye mfumo mmoja ni 1234, basi msimbo wa bidhaa hiyo ni 1234 kwenye kila mfumo wa chanzo.]

Upungufu. Data sawa haipaswi kuhifadhiwa katika sehemu zaidi ya moja kwenye mfumo. Ikiwa, kwa sababu za ufanisi, kipengele cha data kinahifadhiwa kwa makusudi katika sehemu zaidi ya moja katika mfumo, basi uondoaji lazima ubainishwe wazi na kuthibitishwa.
[Upungufu. Data sawa haipaswi kuhifadhiwa katika sehemu zaidi ya moja kwenye mfumo. Iwapo, kwa sababu za ufanisi, kipengele cha data kinahifadhiwa kimakusudi katika maeneo mengi katika mfumo, basi upunguzaji kazi lazima ufafanuliwe wazi na uthibitishwe.]

Ukamilifu. Hakuna maadili yanayokosekana kwa sifa fulani kwenye mfumo. Kwa mfano, katika faili ya mteja, lazima kuwe na thamani halali ya sehemu ya "hali" kwa kila mteja. Katika faili kwa maelezo ya agizo, kila rekodi ya maelezo ya agizo lazima ijazwe kabisa.
[Ukamilifu. Hakuna maadili yanayokosekana katika mfumo wa sifa hii. Kwa mfano, faili ya mteja lazima iwe na thamani halali ya sehemu ya "hali" kwa kila mteja. Katika faili ya maelezo ya agizo, kila rekodi ya maelezo ya agizo lazima ikamilishwe kabisa.]

Rudufu. Kurudiwa kwa rekodi katika mfumo kutatuliwa kabisa. Ikiwa faili ya bidhaa inajulikana kuwa na rekodi za nakala, basi rekodi zote za nakala za kila bidhaa zinatambuliwa na rejeleo mtambuka kuundwa.
[Rudufu. Urudiaji wa rekodi katika mfumo umeondolewa kabisa. Ikiwa faili ya bidhaa inajulikana kuwa na maingizo yanayorudiwa, basi maingizo yote yanayorudiwa kwa kila bidhaa yanatambuliwa na marejeleo mtambuka kuundwa.]

Kuzingatia Sheria za Biashara. Thamani za kila kipengee cha data hufuata sheria za biashara zilizowekwa. Katika mfumo wa mnada, bei ya nyundo au mauzo haiwezi kuwa chini ya bei iliyohifadhiwa. Katika mfumo wa mkopo wa benki, salio la mkopo lazima liwe chanya au sifuri.
[Kuzingatia sheria za biashara. Thamani za kila kipengele cha data zinatii sheria zilizowekwa za biashara. Katika mfumo wa mnada, bei ya nyundo au mauzo haiwezi kuwa chini ya bei iliyohifadhiwa. Katika mfumo wa mikopo wa benki, salio la mkopo lazima liwe chanya au sufuri.]

Uhakika wa Kimuundo. Popote ambapo kipengee cha data kinaweza kupangwa katika vipengele vya kibinafsi, kipengee lazima kiwe na muundo huu uliobainishwa vyema. Kwa mfano, jina la mtu binafsi kawaida hugawanyika katika jina la kwanza, jina la kati na la mwisho. Thamani za majina ya watu binafsi lazima zihifadhiwe kama jina la kwanza, herufi ya kati na jina la mwisho. Sifa hii ya ubora wa data hurahisisha utekelezwaji wa viwango na kupunguza thamani zinazokosekana.
[Hakika ya Muundo. Ambapo kipengele cha data kinaweza kupangwa katika vipengele vya mtu binafsi, kipengele lazima kiwe na muundo huu uliobainishwa vyema. Kwa mfano, jina la mtu limegawanywa kwa asili katika jina la kwanza, la kati na la mwisho. Thamani za majina ya kibinafsi zinapaswa kuhifadhiwa kama jina la kwanza, jina la kati na jina la mwisho. Sifa hii ya ubora wa data hurahisisha utumiaji wa viwango na kupunguza thamani zinazokosekana.]

Ukosefu wa Takwimu. Sehemu lazima itumike kwa madhumuni ambayo imefafanuliwa. Ikiwa shamba Anwani-3 imefafanuliwa kwa mstari wowote wa tatu unaowezekana wa anwani kwa anwani ndefu, basi sehemu hii lazima itumike tu kwa kurekodi mstari wa tatu wa anwani. Ni lazima isitumike kwa kuweka simu au nambari ya faksi kwa mteja.
[Data Anomaly. Sehemu lazima itumike tu kwa madhumuni ambayo imefafanuliwa. Ikiwa sehemu ya Anwani-3 imefafanuliwa kwa laini yoyote ya tatu ya anwani inayowezekana kwa anwani ndefu, basi sehemu hii itatumika tu kurekodi laini ya tatu ya anwani. Haipaswi kutumiwa kuweka nambari ya simu au faksi kwa mteja.]

Uwazi. Kipengele cha data kinaweza kuwa na sifa nyingine zote za data ya ubora lakini ikiwa watumiaji hawaelewi maana yake kwa uwazi, basi kipengele cha data hakina thamani kwa watumiaji. Kanuni sahihi za kutaja husaidia kufanya vipengele vya data kueleweka vyema na watumiaji.
[Uwazi. Kipengele cha data kinaweza kuwa na sifa nyingine zote za data nzuri, lakini ikiwa watumiaji hawaelewi maana yake kwa uwazi, basi kipengele cha data hakina thamani kwa watumiaji. Kanuni sahihi za kutaja husaidia kufanya vipengele vya data kueleweka vyema na watumiaji.]

Kwa wakati muafaka. Watumiaji huamua wakati wa data. Iwapo watumiaji wanatarajia data ya vipimo vya mteja isizidi siku moja, mabadiliko ya data ya mteja katika mifumo ya chanzo lazima yatumike kwenye ghala la data kila siku.
[Kwa wakati ufaao. Watumiaji huamua ufaafu wa data. Iwapo watumiaji wanatarajia data ya vipimo vya mteja isizidi siku moja, mabadiliko ya data ya mteja katika mifumo ya chanzo yanapaswa kutumika kwenye ghala la data kila siku.]

Manufaa. Kila kipengele cha data kwenye ghala la data lazima kikidhi mahitaji fulani ya mkusanyiko wa watumiaji. Kipengele cha data kinaweza kuwa sahihi na cha ubora wa juu, lakini ikiwa hakina thamani kwa watumiaji, basi si lazima kabisa kipengele hicho cha data kiwe kwenye ghala la data.
[Utility. Kila kipengee cha data katika hifadhi ya data lazima kikidhi mahitaji fulani ya mkusanyiko wa mtumiaji. Kipengele cha data kinaweza kuwa sahihi na cha ubora wa juu, lakini ikiwa hakitoi thamani kwa watumiaji, basi si lazima kipengele hicho cha data kiwe kwenye ghala la data.]

Kuzingatia Sheria za Uadilifu wa Data. Data iliyohifadhiwa katika hifadhidata za uhusiano za mifumo ya chanzo lazima izingatie uadilifu wa huluki na sheria za uadilifu wa marejeleo. Jedwali lolote linaloruhusu kubatilisha kama ufunguo msingi halina uadilifu wa huluki. Uadilifu wa urejeleo hulazimisha kuanzishwa kwa uhusiano wa mzazi na mtoto kwa usahihi. Katika uhusiano kati ya mteja na agizo, uadilifu wa urejeleaji huhakikisha kuwepo kwa mteja kwa kila agizo katika hifadhidata.
[Kuzingatia sheria za uadilifu wa data. Data iliyohifadhiwa katika hifadhidata za uhusiano za mifumo ya chanzo lazima ifuate sheria za uadilifu wa huluki na uadilifu wa marejeleo. Jedwali lolote linaloruhusu null kama ufunguo msingi halina uadilifu wa huluki. Uadilifu wa urejeleo hulazimisha uhusiano kati ya wazazi na watoto kuanzishwa kwa usahihi. Katika uhusiano wa agizo la mteja, uadilifu wa urejeleaji huhakikisha kuwa mteja yupo kwa kila agizo katika hifadhidata.]

4. Ubora wa kusafisha data

Ubora wa kusafisha data ni suala lenye shida katika data kubwa. Kujibu swali la ni kiwango gani cha kusafisha data ni muhimu ili kukamilisha kazi ni muhimu kwa kila mchambuzi wa data. Katika matatizo mengi ya sasa, kila mchambuzi huamua hili mwenyewe na hakuna uwezekano kwamba mtu yeyote kutoka nje anaweza kutathmini kipengele hiki katika ufumbuzi wake. Lakini kwa kazi iliyopo katika kesi hii, suala hili lilikuwa muhimu sana, kwani kuegemea kwa data ya kisheria inapaswa kuwa moja.

Kuzingatia teknolojia za kupima programu ili kuamua uaminifu wa uendeshaji. Leo kuna zaidi ya mifano hii 200. Aina nyingi hutumia mfano wa huduma ya madai:

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mtini. Xnumx

Kufikiria kama ifuatavyo: "Ikiwa kosa lililopatikana ni tukio sawa na tukio la kutofaulu katika mfano huu, basi jinsi ya kupata analog ya parameta t?" Na nikakusanya mfano ufuatao: Wacha tufikirie kuwa wakati inachukua mjaribu kuangalia rekodi moja ni dakika 1 (kwa hifadhidata inayohusika), kisha kupata makosa yote atahitaji dakika 365, ambayo ni takriban miaka 494 na 3. miezi ya muda wa kazi. Kama tunavyoelewa, hii ni kiasi kikubwa sana cha kazi na gharama za kuangalia hifadhidata itakuwa kubwa kwa mkusanyaji wa hifadhidata hii. Katika tafakari hii, dhana ya kiuchumi ya gharama inaonekana na baada ya uchambuzi nilifikia hitimisho kwamba hii ni chombo cha ufanisi cha haki. Kulingana na sheria ya uchumi: "Kiasi cha uzalishaji (katika vitengo) ambapo faida ya juu ya kampuni hupatikana iko katika kiwango ambacho gharama ya chini ya uzalishaji wa kitengo kipya cha pato inalinganishwa na bei ambayo kampuni hii inaweza kupokea. kwa kitengo kipya." Kulingana na maoni kwamba kutafuta kila kosa linalofuata kunahitaji ukaguzi zaidi na zaidi wa rekodi, hii ni sababu ya gharama. Hiyo ni, postulate iliyopitishwa katika mifano ya kupima inachukua maana ya kimwili katika muundo wafuatayo: ikiwa ili kupata kosa la i-th ilikuwa ni lazima kuangalia rekodi za n, kisha kupata kosa linalofuata (i+3) itakuwa muhimu. kuangalia rekodi za m na wakati huo huo n

  1. Wakati idadi ya rekodi zilizokaguliwa kabla ya kosa jipya kupatikana imetulia;
  2. Wakati idadi ya rekodi zilizoangaliwa kabla ya kupata hitilafu inayofuata itaongezeka.

Kuamua thamani muhimu, niligeukia dhana ya uwezekano wa kiuchumi, ambayo katika kesi hii, kwa kutumia dhana ya gharama za kijamii, inaweza kutengenezwa kama ifuatavyo: "Gharama za kurekebisha kosa zinapaswa kubebwa na wakala wa kiuchumi anayeweza kufanya. kwa gharama ya chini kabisa.” Tuna wakala mmoja - anayejaribu ambaye hutumia dakika 1 kuangalia rekodi moja. Kwa maneno ya fedha, ikiwa unapata rubles 6000 / siku, hii itakuwa rubles 12,2. (takriban leo). Inabakia kuamua upande wa pili wa usawa katika sheria ya kiuchumi. Nilifikiri hivi. Hitilafu iliyopo itahitaji mtu anayehusika kutumia jitihada za kurekebisha, yaani, mmiliki wa mali. Hebu sema hii inahitaji siku 1 ya hatua (tuma maombi, kupokea hati iliyosahihishwa). Kisha, kutoka kwa mtazamo wa kijamii, gharama zake zitakuwa sawa na mshahara wa wastani kwa siku. Wastani wa mshahara ulioongezwa katika Khanty-Mansi Autonomous Okrug "Matokeo ya maendeleo ya kijamii na kiuchumi ya Khanty-Mansiysk Autonomous Okrug - Ugra kwa Januari-Septemba 2019" 73285 kusugua. au rubles 3053,542 / siku. Ipasavyo, tunapata thamani muhimu sawa na:
3053,542: 12,2 = vitengo 250,4 vya kumbukumbu.

Hii inamaanisha, kutoka kwa mtazamo wa kijamii, ikiwa mjaribu aliangalia rekodi 251 na akapata kosa moja, ni sawa na mtumiaji kurekebisha kosa hili mwenyewe. Ipasavyo, ikiwa tester alitumia muda sawa na kuangalia rekodi 252 ili kupata kosa linalofuata, basi katika kesi hii ni bora kuhamisha gharama ya marekebisho kwa mtumiaji.

Njia iliyorahisishwa imewasilishwa hapa, kwa kuwa kutoka kwa mtazamo wa kijamii ni muhimu kuzingatia thamani yote ya ziada inayotokana na kila mtaalamu, yaani, gharama ikiwa ni pamoja na kodi na malipo ya kijamii, lakini mfano ni wazi. Matokeo ya uhusiano huu ni mahitaji yafuatayo kwa wataalamu: mtaalamu kutoka sekta ya IT lazima awe na mshahara mkubwa zaidi kuliko wastani wa kitaifa. Ikiwa mshahara wake ni chini ya wastani wa mshahara wa watumiaji wa hifadhidata, basi yeye mwenyewe lazima aangalie hifadhidata nzima kwa mkono.

Wakati wa kutumia kigezo kilichoelezewa, hitaji la kwanza la ubora wa hifadhidata huundwa:
Mimi (tr). Sehemu ya makosa muhimu haipaswi kuzidi 1/250,4 = 0,39938%. Kidogo kidogo kuliko kusafisha dhahabu katika viwanda. Na kwa maneno ya kimwili hakuna rekodi zaidi ya 1459 zilizo na makosa.

Marudio ya kiuchumi.

Kwa kweli, kwa kufanya idadi kama hii ya makosa katika rekodi, jamii inakubali hasara za kiuchumi kwa kiasi cha:

1459 * 3053,542 = 4 rubles.

Kiasi hiki kinaamuliwa na ukweli kwamba jamii haina zana za kupunguza gharama hizi. Inafuata kwamba ikiwa mtu ana teknolojia inayomruhusu kupunguza idadi ya rekodi zilizo na makosa, kwa mfano, 259, basi hii itaruhusu jamii kuokoa:
1200 * 3053,542 = 3 rubles.

Lakini wakati huo huo, anaweza kuuliza talanta yake na kazi, vizuri, tuseme - rubles milioni 1.
Hiyo ni, gharama za kijamii zinapunguzwa na:

3 - 664 = 250 rubles.

Kwa asili, athari hii ni thamani iliyoongezwa kutoka kwa matumizi ya teknolojia ya BigDat.

Lakini hapa inapaswa kuzingatiwa kuwa hii ni athari ya kijamii, na mmiliki wa database ni mamlaka ya manispaa, mapato yao kutokana na matumizi ya mali iliyoandikwa katika hifadhidata hii, kwa kiwango cha 0,3%, ni: 2,778 bilioni rubles / mwaka. Na gharama hizi (rubles 4) hazimsumbui sana, kwani zinahamishiwa kwa wamiliki wa mali. Na, katika kipengele hiki, msanidi wa teknolojia za uboreshaji zaidi katika Bigdata atalazimika kuonyesha uwezo wa kumshawishi mmiliki wa hifadhidata hii, na vitu kama hivyo vinahitaji talanta kubwa.

Katika mfano huu, kanuni ya tathmini ya makosa ilichaguliwa kulingana na muundo wa Schumann [2] wa uthibitishaji wa programu wakati wa majaribio ya kutegemewa. Kutokana na kuenea kwake kwenye mtandao na uwezo wa kupata viashiria muhimu vya takwimu. Mbinu hiyo inachukuliwa kutoka Monakhov Yu.M. "Utulivu wa utendaji wa mifumo ya habari", angalia chini ya mharibifu kwenye Mtini. 7-9.

Mchele. 7 - 9 Mbinu ya mfano wa SchumannSafisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia

Sehemu ya pili ya nyenzo hii inatoa mfano wa kusafisha data, ambayo matokeo ya kutumia mfano wa Schumann hupatikana.
Acha niwasilishe matokeo yaliyopatikana:
Idadi iliyokadiriwa ya makosa N = 3167 n.
Kigezo C, lambda na kazi ya kutegemewa:

Safisha data kama vile mchezo wa Rock, Karatasi, Mikasi. Je, huu ni mchezo wenye mwisho au usio na mwisho? Sehemu ya 1. Kinadharia
Mtini. 17

Kimsingi, lambda ni kiashiria halisi cha ukubwa ambao makosa hugunduliwa katika kila hatua. Ikiwa unatazama sehemu ya pili, makadirio ya kiashiria hiki yalikuwa makosa 42,4 kwa saa, ambayo ni sawa kabisa na kiashiria cha Schumann. Hapo juu, iliamua kuwa kiwango ambacho msanidi hupata makosa haipaswi kuwa chini ya kosa 1 kwa rekodi 250,4, wakati wa kuangalia rekodi 1 kwa dakika. Kwa hivyo thamani muhimu ya lambda kwa mfano wa Schumann:

60 / 250,4 = 0,239617.

Hiyo ni, hitaji la kutekeleza taratibu za kugundua makosa lazima lifanyike hadi lambda, kutoka kwa 38,964 iliyopo, itapungua hadi 0,239617.

Au mpaka kiashiria N (idadi inayowezekana ya makosa) kuondoa n (idadi iliyosahihishwa ya makosa) itapungua chini ya kizingiti chetu kinachokubalika - pcs 1459.

Fasihi

  1. Monakhov, Yu. M. Utulivu wa kazi wa mifumo ya habari. Katika saa 3. Sehemu ya 1. Kuegemea kwa programu: kitabu cha kiada. posho / Yu. M. Monakhov; Vladim. jimbo chuo kikuu. – Vladimir: Izvo Vladim. jimbo Chuo Kikuu, 2011. - 60 p. – ISBN 978-5-9984-0189-3.
  2. Martin L. Shooman, "Miundo ya uwezekano wa utabiri wa kutegemewa kwa programu."
  3. Misingi ya kuhifadhi data kwa wataalamu wa IT / Paulraj Ponniah.β€” Toleo la 2.

Sehemu ya pili. Kinadharia

Chanzo: mapenzi.com

Kuongeza maoni