Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku

1. Data inizjali

It-tindif tad-dejta huwa wieħed mill-isfidi li jiffaċċjaw il-kompiti tal-analiżi tad-dejta. Dan il-materjal jirrifletti l-iżviluppi u s-soluzzjonijiet li nħolqu bħala riżultat tas-soluzzjoni ta 'problema prattika ta' analiżi tad-database fil-formazzjoni tal-valur katastali. Sorsi hawn "RAPPORT Nru 01/OKS-2019 dwar ir-riżultati tal-valutazzjoni katastali statali tat-tipi kollha ta 'proprjetà immobbli (ħlief għal plottijiet ta' art) fit-territorju tal-Okrug Awtonomu Khanty-Mansiysk - Ugra".

Tqies il-fajl "Mudell komparattiv total.ods" f'"Appendiċi B. Riżultati tad-determinazzjoni ta' KS 5. Informazzjoni dwar il-metodu ta' determinazzjoni tal-valur katastali 5.1 Approċċ komparattiv".

Tabella 1. Indikaturi statistiċi tas-sett tad-dejta fil-fajl “Mudell komparattiv total.ods”
Numru totali ta' oqsma, pcs. — 44
Numru totali ta' rekords, pcs. — 365 490
Numru totali ta 'karattri, pcs. — 101 714 693
Numru medju ta' karattri f'rekord, pcs. — 278,297
Devjazzjoni standard ta' karattri f'rekord, pcs. — 15,510
Numru minimu ta' karattri f'entrata, pcs. — 198
Numru massimu ta' karattri f'entrata, pcs. — 363

2. Parti introduttorja. Standards bażiċi

Waqt l-analiżi tad-database speċifikata, ġie ffurmat kompitu biex jiġu speċifikati r-rekwiżiti għall-grad ta 'purifikazzjoni, peress li, kif jidher ċar għal kulħadd, id-database speċifikata toħloq konsegwenzi legali u ekonomiċi għall-utenti. Matul ix-xogħol, irriżulta li ma kien hemm l-ebda rekwiżiti speċifiċi għall-grad ta 'tindif tal-big data. Meta analizzat in-normi legali f'din il-kwistjoni, wasalt għall-konklużjoni li huma kollha ffurmati minn possibbiltajiet. Jiġifieri, deher ċertu kompitu, is-sorsi ta 'informazzjoni huma kkompilati għall-kompitu, imbagħad jiġi ffurmat dataset u, ibbażat fuq id-dataset maħluq, għodod biex issolvi l-problema. Is-soluzzjonijiet li jirriżultaw huma punti ta' referenza fl-għażla minn alternattivi. I ppreżentat dan fil-Figura 1.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku

Peress li, fi kwistjonijiet ta 'determinazzjoni ta' kwalunkwe standard, huwa preferibbli li nistrieħ fuq teknoloġiji ppruvati, għażilt ir-rekwiżiti stabbiliti f' "Definizzjonijiet u Gwida tal-Integrità tad-Data tal-MHRA GxP għall-Industrija", għaliex jien qiest dan id-dokument bħala l-aktar komprensiv għal din il-kwistjoni. B'mod partikolari, f'dan id-dokument it-taqsima tgħid "Ta' min jinnota li r-rekwiżiti tal-integrità tad-dejta japplikaw bl-istess mod għad-dejta manwali (karta) u elettronika." (traduzzjoni: “...rekwiżiti ta’ integrità tad-data japplikaw bl-istess mod għal data manwali (karta) u elettronika”). Din il-formulazzjoni hija pjuttost speċifikament assoċjata mal-kunċett ta '"evidenza bil-miktub", fid-dispożizzjonijiet tal-Artikolu 71 tal-Kodiċi ta' Proċedura Ċivili, Art. 70 CAS, Art 75 APC, “bil-miktub” Art. 84 Kodiċi ta' Proċedura Ċivili.

Il-Figura 2 tippreżenta dijagramma tal-formazzjoni ta 'approċċi għal tipi ta' informazzjoni fil-ġurisprudenza.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Ross. 2. Sors hawn.

Il-Figura 3 turi l-mekkaniżmu tal-Figura 1, għall-kompiti tal-"Gwida" ta 'hawn fuq. Huwa faċli, billi jsir paragun, li wieħed jara li l-approċċi użati meta jintlaħqu r-rekwiżiti għall-integrità tal-informazzjoni fl-istandards moderni għas-sistemi tal-informazzjoni huma limitati b'mod sinifikanti meta mqabbla mal-kunċett legali tal-informazzjoni.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Fig. 3

Fid-dokument speċifikat (Gwida), il-konnessjoni mal-parti teknika, kapaċitajiet għall-ipproċessar u l-ħażna tad-dejta, hija kkonfermata sew minn kwotazzjoni mill-Kapitolu 18.2. Database relazzjonali: "Din l-istruttura tal-fajl hija intrinsikament aktar sigura, peress li d-dejta tinżamm f'format ta 'fajl kbir li jippreserva r-relazzjoni bejn id-dejta u l-metadejta."

Fil-fatt, f'dan l-approċċ - mill-kapaċitajiet tekniċi eżistenti, m'hemm xejn anormali u, fih innifsu, dan huwa proċess naturali, peress li l-espansjoni tal-kunċetti ġejja mill-attività l-aktar studjata - id-disinn tad-database. Iżda, min-naħa l-oħra, jidhru normi legali li ma jipprovdux għal skontijiet fuq il-kapaċitajiet tekniċi ta 'sistemi eżistenti, pereżempju: GDPR - Regolament Ġenerali dwar il-Protezzjoni tad-Data.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Ross. 4. Lembut tal-kapaċitajiet tekniċi (Sors).

F'dawn l-aspetti, jidher ċar li s-sett tad-dejta oriġinali (Fig. 1) se jkollu, l-ewwel nett, jiġi ffrankat, u t-tieni, ikun il-bażi għall-estrazzjoni ta 'informazzjoni addizzjonali minnu. Ukoll, bħala eżempju: kameras li jirreġistraw ir-regoli tat-traffiku huma kullimkien, is-sistemi ta 'pproċessar ta' informazzjoni jeliminaw lil min jikser, iżda informazzjoni oħra tista 'tiġi offruta wkoll lil konsumaturi oħra, pereżempju, bħala monitoraġġ tal-kummerċjalizzazzjoni tal-istruttura tal-fluss tal-klijenti lejn ċentru tax-xiri. U dan huwa sors ta 'valur miżjud addizzjonali meta tuża BigDat. Huwa pjuttost possibbli li s-settijiet tad-dejta li qed jinġabru issa, x'imkien fil-futur, ikollhom valur skont mekkaniżmu simili għall-valur tal-edizzjonijiet rari tal-1700 fil-preżent. Wara kollox, fil-fatt, is-settijiet tad-dejta temporanji huma uniċi u x'aktarx ma jiġux ripetuti fil-futur.

3. Parti introduttorja. Kriterji ta' evalwazzjoni

Matul il-proċess tal-ipproċessar, ġiet żviluppata l-klassifikazzjoni ta 'żbalji li ġejja.

1. Klassi ta 'żball (ibbażat fuq GOST R 8.736-2011): a) żbalji sistematiċi; b) żbalji każwali; c) tfixkil.

2. Bil-multipliċità: a) distorsjoni mono; b) multi-distorsjoni.

3. Skont il-kritika tal-konsegwenzi: a) kritika; b) mhux kritiku.

4. Skont is-sors tal-okkorrenza:

A) Tekniċi – żbalji li jseħħu waqt it-tħaddim tat-tagħmir. Żball pjuttost rilevanti għal sistemi IoT, sistemi bi grad sinifikanti ta 'influwenza fuq il-kwalità tal-komunikazzjoni, tagħmir (ħardwer).

B) Żbalji tal-operatur - żbalji f'firxa wiesgħa minn typos tal-operatur waqt l-input għal żbalji fl-ispeċifikazzjonijiet tekniċi għad-disinn tad-database.

C) Żbalji ta 'l-utent - hawn huma żbalji ta' l-utent fil-firxa kollha minn "insejt taqleb it-tqassim" għal metru żbaljat għal saqajn.

5. Separati fi klassi separata:

a) il-“kompitu tas-separatur”, jiġifieri, l-ispazju u “:” (fil-każ tagħna) meta kien duplikat;
b) kliem miktub flimkien;
c) ebda spazju wara karattri tas-servizz
d) simboli multipli simmetrikament: (), "", "...".

Meħuda flimkien, mas-sistematizzazzjoni tal-iżbalji tad-database ppreżentata fil-Figura 5, hija ffurmata sistema ta 'koordinati pjuttost effettiva għat-tiftix għal żbalji u l-iżvilupp ta' algoritmu tat-tindif tad-dejta għal dan l-eżempju.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Ross. 5. Żbalji tipiċi li jikkorrispondu għall-unitajiet strutturali tad-database (Sors: Oreshkov V.I., Paklin N.B. "Kunċetti ewlenin tal-konsolidazzjoni tad-dejta").

Preċiżjoni, Integrità tad-Dominju, Tip tad-Data, Konsistenza, Redundancy, Kompletezza, Duplikazzjoni, Konformità mar-Regoli tan-Negozju, Definitezza Strutturali, Anomalja tad-Data, Ċarezza, F'waqtha, Aderenza mar-Regoli dwar l-Integrità tad-Data. (Paġna 334. Il-prinċipji fundamentali tal-magazzinaġġ tad-dejta għall-professjonisti tal-IT / Paulraj Ponniah.—it-2 ed.)

Ippreżenta kliem bl-Ingliż u traduzzjoni awtomatika Russa fil-parentesi.

Eżattezza. Il-valur maħżun fis-sistema għal element tad-dejta huwa l-valur it-tajjeb għal dik l-okkorrenza tal-element tad-dejta. Jekk għandek isem tal-klijent u indirizz maħżun f'rekord, allura l-indirizz huwa l-indirizz korrett għall-klijent b'dak l-isem. Jekk issib il-kwantità ordnata bħala 1000 unità fir-rekord għan-numru tal-ordni 12345678, allura dik il-kwantità hija l-kwantità preċiża għal dik l-ordni.
[Eżattezza. Il-valur maħżun fis-sistema għal element tad-dejta huwa l-valur korrett għal dik l-okkorrenza tal-element tad-dejta. Jekk għandek isem u indirizz tal-klijent maħżuna f'rekord, allura l-indirizz huwa l-indirizz korrett għall-klijent b'dak l-isem. Jekk issib il-kwantità ordnata bħala 1000 unità fir-rekord għan-numru tal-ordni 12345678, allura dik il-kwantità hija l-kwantità eżatta għal dik l-ordni.]

Integrità tad-Dominju. Il-valur tad-dejta ta' attribut jaqa' fil-medda ta' valuri permissibbli u definiti. L-eżempju komuni huwa l-valuri permissibbli li huma "irġiel" u "femminili" għall-element tad-dejta tal-ġeneru.
[Integrità tad-Dominju. Il-valur tad-dejta tal-attribut jaqa' fil-medda ta' valuri validi u definiti. Eżempju ġenerali huwa l-valuri validi "irġiel" u "femminili" għal element tad-dejta dwar is-sess.]

Tip ta' Data. Il-valur għal attribut tad-dejta huwa attwalment maħżun bħala t-tip tad-dejta definit għal dak l-attribut. Meta t-tip tad-dejta tal-qasam tal-isem tal-maħżen huwa definit bħala "test," l-istanzi kollha ta 'dak il-qasam ikun fihom l-isem tal-maħżen muri f'format testwali u mhux kodiċi numeriċi.
[Tip tad-dejta. Il-valur ta' attribut ta' dejta huwa attwalment maħżun bħala t-tip ta' dejta definit għal dak l-attribut. Jekk it-tip tad-dejta tal-qasam tal-isem tal-maħżen huwa definit bħala "test", l-istanzi kollha ta' dan il-qasam fihom l-isem tal-maħżen muri f'format ta' test aktar milli kodiċi numeriċi.]

Konsistenza. Il-forma u l-kontenut ta' qasam tad-dejta huma l-istess f'sistemi ta' sorsi multipli. Jekk il-kodiċi tal-prodott għall-prodott ABC f'sistema waħda huwa 1234, allura l-kodiċi għal dan il-prodott huwa 1234 f'kull sistema tas-sors.
[Konsistenza. Il-forma u l-kontenut tal-qasam tad-dejta huma l-istess f'sistemi ta' sors differenti. Jekk il-kodiċi tal-prodott għall-prodott ABC fuq sistema waħda huwa 1234, allura l-kodiċi għal dak il-prodott huwa 1234 fuq kull sistema sors.]

Redundancy. L-istess data m'għandhiex tkun maħżuna f'aktar minn post wieħed f'sistema. Jekk, għal raġunijiet ta' effiċjenza, element ta' data jinħażen intenzjonalment f'aktar minn post wieħed f'sistema, allura s-sensja għandha tiġi identifikata u verifikata b'mod ċar.
[Ssensja. L-istess data m'għandhiex tinħażen f'aktar minn post wieħed fis-sistema. Jekk, għal raġunijiet ta' effiċjenza, element ta' dejta jinħażen intenzjonalment f'postijiet multipli f'sistema, allura s-sensja għandha tkun definita u verifikata b'mod ċar.]

Kompletezza. M'hemm l-ebda valuri neqsin għal attribut partikolari fis-sistema. Pereżempju, f'fajl tal-klijent, għandu jkun hemm valur validu għall-qasam "stat" għal kull klijent. Fil-fajl għad-dettalji tal-ordni, kull rekord tad-dettall għal ordni għandu jimtela kompletament.
[Kompletezza. M'hemm l-ebda valuri neqsin fis-sistema għal dan l-attribut. Pereżempju, il-fajl tal-klijent għandu jkollu valur validu għall-qasam "status" għal kull klijent. Fil-fajl tad-dettall tal-ordni, kull rekord tad-dettall tal-ordni għandu jimtela kompletament.]

Duplikazzjoni. Id-duplikazzjoni tar-rekords f'sistema tiġi solvuta kompletament. Jekk il-fajl tal-prodott huwa magħruf li għandu rekords duplikati, allura r-rekords duplikati kollha għal kull prodott huma identifikati u tinħoloq cross-reference.
[Duplikat. Id-duplikazzjoni tar-rekords fis-sistema ġiet eliminata kompletament. Jekk fajl tal-prodott huwa magħruf li fih entrati duplikati, allura l-entrati duplikati kollha għal kull prodott jiġu identifikati u tinħoloq cross-reference.]

Konformità mar-Regoli tan-Negozju. Il-valuri ta 'kull oġġett tad-dejta jaderixxu mar-regoli tan-negozju preskritti. F'sistema ta 'rkant, il-prezz tal-martell jew tal-bejgħ ma jistax ikun inqas mill-prezz ta' riżerva. F'sistema ta' self bankarju, il-bilanċ tas-self irid ikun dejjem pożittiv jew żero.
[Konformità mar-regoli tan-negozju. Il-valuri ta’ kull element tad-dejta jikkonformaw mar-regoli tan-negozju stabbiliti. F'sistema ta 'rkant, il-prezz tal-martell jew tal-bejgħ ma jistax ikun inqas mill-prezz ta' riżerva. F'sistema ta' kreditu bankarju, il-bilanċ tas-self għandu dejjem ikun pożittiv jew żero.]

Definizzjoni Strutturali. Kull fejn oġġett tad-dejta jista' naturalment jiġi strutturat f'komponenti individwali, l-oġġett għandu jkun fih din l-istruttura definita sew. Per eżempju, isem ta 'individwu naturalment jaqsam fl-isem, inizjali tan-nofs, u l-kunjom. Il-valuri għall-ismijiet tal-individwi għandhom jinħażnu bħala l-isem, l-inizjali tan-nofs, u l-kunjom. Din il-karatteristika tal-kwalità tad-dejta tissimplifika l-infurzar tal-istandards u tnaqqas il-valuri neqsin.
[Ċertezza Strutturali. Fejn element tad-dejta jista' jiġi strutturat b'mod naturali f'komponenti individwali, l-element għandu jkun fih din l-istruttura definita sew. Per eżempju, l-isem ta 'persuna huwa naturalment maqsum fl-isem, inizjali tan-nofs, u l-kunjom. Il-valuri għall-ismijiet individwali għandhom jinħażnu bħala l-isem, l-inizjali tan-nofs, u l-kunjom. Din il-karatteristika tal-kwalità tad-dejta tissimplifika l-applikazzjoni tal-istandards u tnaqqas il-valuri neqsin.]

Anomalja tad-Data. Field għandu jintuża biss għall-iskop li għalih huwa definit. Jekk il-qasam Indirizz-3 huwa definit għal kwalunkwe tielet linja ta' indirizz possibbli għal indirizzi twal, allura dan il-qasam għandu jintuża biss għar-reġistrazzjoni tat-tielet linja ta' indirizz. M'għandux jintuża biex jiddaħħal numru tat-telefon jew tal-fax għall-klijent.
[Anomalija tad-Data. Field għandu jintuża biss għall-iskop li għalih huwa definit. Jekk il-field Address-3 huwa definit għal kwalunkwe linja ta' indirizz terz possibbli għal indirizzi twal, allura dan il-qasam għandu jintuża biss biex jirreġistra t-tielet linja ta' indirizz. M'għandux jintuża biex jidħol numru tat-telefon jew tal-fax għal klijent.]

Ċarezza. Element ta' dejta jista' jkollu l-karatteristiċi l-oħra kollha ta' dejta ta' kwalità iżda jekk l-utenti ma jifhmux it-tifsira tagħha b'mod ċar, allura l-element ta' dejta m'għandu l-ebda valur għall-utenti. Konvenzjonijiet ta' ismijiet xierqa jgħinu biex l-elementi tad-dejta jinftiehmu sew mill-utenti.
[Ċarezza. Element tad-dejta jista' jkollu l-karatteristiċi l-oħra kollha ta' dejta tajba, iżda jekk l-utenti ma jifhmux b'mod ċar it-tifsira tiegħu, allura l-element tad-dejta m'għandu l-ebda valur għall-utenti. Konvenzjonijiet ta' ismijiet korretti jgħinu biex l-elementi tad-dejta jinftiehmu sew mill-utenti.]

F'waqtu. L-utenti jiddeterminaw il-puntwalità tad-dejta. Jekk l-utenti jistennew li d-dejta tad-dimensjoni tal-klijent ma tkunx aktar minn ġurnata waħda, il-bidliet fid-dejta tal-klijenti fis-sistemi tas-sors għandhom jiġu applikati għall-maħżen tad-dejta kuljum.
[Fil-ħin. L-utenti jiddeterminaw il-puntwalità tad-dejta. Jekk l-utenti jistennew li d-dejta tad-dimensjoni tal-klijent ma tkunx aktar minn ġurnata, il-bidliet fid-dejta tal-klijenti fis-sistemi tas-sors għandhom jiġu applikati għall-maħżen tad-dejta fuq bażi ta’ kuljum.]

Utilità. Kull element tad-dejta fil-maħżen tad-dejta għandu jissodisfa xi rekwiżiti tal-ġbir tal-utenti. Element tad-dejta jista' jkun preċiż u ta' kwalità għolja, iżda jekk ma jkunx ta' valur għall-utenti, allura ma jkunx meħtieġ għal kollox li dak l-element tad-dejta jkun fil-maħżen tad-dejta.
[Utilità. Kull oġġett tad-dejta fil-maħżen tad-dejta għandu jissodisfa xi rekwiżiti tal-ġbir tal-utent. Element tad-dejta jista' jkun preċiż u ta' kwalità għolja, iżda jekk ma jipprovdix valur lill-utenti, allura mhux meħtieġ li dak l-element tad-dejta jkun fil-maħżen tad-dejta.]

Aderenza mar-Regoli dwar l-Integrità tad-Data. Id-dejta maħżuna fid-databases relazzjonali tas-sistemi tas-sors għandha taderixxi mar-regoli tal-integrità tal-entità u l-integrità referenzjali. Kwalunkwe tabella li tippermetti null bħala ċ-ċavetta primarja m'għandhiex integrità tal-entità. L-integrità referenzjali ġġiegħel l-istabbiliment tar-relazzjonijiet bejn il-ġenituri u t-tfal b'mod korrett. F'relazzjoni klijent għal ordni, l-integrità referenzjali tiżgura l-eżistenza ta 'klijent għal kull ordni fid-database.
[Konformità mar-regoli dwar l-integrità tad-dejta. Id-dejta maħżuna f'databases relazzjonali tas-sistemi tas-sors għandha tikkonforma mar-regoli tal-integrità tal-entità u l-integrità referenzjali. Kwalunkwe tabella li tippermetti null bħala ċavetta primarja m'għandhiex integrità tal-entità. L-integrità referenzjali ġġiegħel li r-relazzjoni bejn il-ġenituri u t-tfal tiġi stabbilita b'mod korrett. F'relazzjoni klijent-ordni, l-integrità referenzjali tiżgura li jeżisti klijent għal kull ordni fid-database.]

4. Kwalità tat-tindif tad-data

Il-kwalità tat-tindif tad-dejta hija kwistjoni pjuttost problematika fil-bigdata. Li twieġeb il-mistoqsija dwar liema grad ta 'tindif tad-dejta huwa meħtieġ biex jitlesta l-kompitu huwa fundamentali għal kull analista tad-dejta. Fil-biċċa l-kbira tal-problemi attwali, kull analista jiddetermina dan hu stess u mhux probabbli li xi ħadd minn barra jkun kapaċi jevalwa dan l-aspett fis-soluzzjoni tiegħu. Iżda għall-kompitu inkwistjoni f'dan il-każ, din il-kwistjoni kienet estremament importanti, peress li l-affidabbiltà tad-dejta legali għandha t-tendenza għal waħda.

Jikkunsidraw it-teknoloġiji tal-ittestjar tas-softwer biex jiddeterminaw l-affidabbiltà operattiva. Illum hemm aktar minn dawn il-mudelli 200. Ħafna mill-mudelli jużaw mudell ta' servizz ta' pretensjoni:

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Fig. 6

Taħseb kif ġej: "Jekk l-iżball misjub huwa avveniment simili għall-avveniment ta 'falliment f'dan il-mudell, allura kif issib analogu tal-parametru t?" U kkumpilajt il-mudell li ġej: Ejja nimmaġinaw li l-ħin li jieħu tester biex jiċċekkja rekord wieħed huwa 1 minuta (għad-database in kwistjoni), imbagħad biex isib l-iżbalji kollha ser ikollu bżonn 365 minuta, li huwa madwar 494 snin u 3 xhur ta’ ħin tax-xogħol. Kif nifhmu, dan huwa ammont kbir ħafna ta 'xogħol u l-ispejjeż tal-iċċekkjar tad-database se jkunu projbittivi għall-kompilatur ta' din id-database. F’din ir-riflessjoni, jidher il-kunċett ekonomiku tal-ispejjeż u wara analiżi wasalt għall-konklużjoni li din hija għodda pjuttost effettiva. Ibbażat fuq il-liġi tal-ekonomija: “Il-volum ta’ produzzjoni (f’unitajiet) li bih jinkiseb il-profitt massimu ta’ ditta jinsab fil-punt fejn l-ispiża marġinali tal-produzzjoni ta’ unità ġdida ta’ produzzjoni titqabbel mal-prezz li din id-ditta tista’ tirċievi għal unità ġdida.” Ibbażat fuq il-postulat li s-sejba ta 'kull żball sussegwenti teħtieġ aktar u aktar verifika tar-rekords, dan huwa fattur ta' spiża. Jiġifieri, il-postulat adottat fil-mudelli tal-ittestjar jieħu tifsira fiżika fil-mudell li ġej: jekk biex jinstab l-iżball i-th kien meħtieġ li jiċċekkjaw n rekords, allura biex jinstab l-iżball li jmiss (i+3) ikun meħtieġ biex jiċċekkja m rekords u fl-istess ħin n

  1. Meta n-numru ta' rekords iċċekkjati qabel ma jinstab żball ġdid jistabbilizza;
  2. Meta n-numru ta 'rekords iċċekkjati qabel ma jinstab l-iżball li jmiss se jiżdied.

Biex tiddetermina l-valur kritiku, dawwart għall-kunċett ta’ fattibbiltà ekonomika, li f’dan il-każ, bl-użu tal-kunċett ta’ spejjeż soċjali, jista’ jiġi fformulat kif ġej: “L-ispejjeż tal-korrezzjoni tal-iżball għandhom jitħallsu mill-aġent ekonomiku li jista’ jagħmel. bl-inqas spiża.” Għandna aġent wieħed - tester li jqatta 'minuta jiċċekkja rekord wieħed. F'termini monetarji, jekk taqla '1 rublu / jum, dan ikun 6000 rublu. (madwar illum). Għad irid jiġi ddeterminat it-tieni naħa tal-ekwilibriju fil-liġi ekonomika. Irraġunajt hekk. Żball eżistenti jeħtieġ li l-persuna kkonċernata tagħmel sforz biex tikkoreġih, jiġifieri, is-sid tal-proprjetà. Ejja ngħidu li dan jeħtieġ ġurnata ta' azzjoni (issottometti applikazzjoni, tirċievi dokument korrett). Imbagħad, mil-lat soċjali, l-ispejjeż tiegħu jkunu ugwali għas-salarju medju kuljum. Salarju medju akkumulat f'Khanty-Mansi Awtonomu Okrug "Riżultati tal-iżvilupp soċjoekonomiku tal-Okrug Awtonomu Khanty-Mansiysk - Ugra għal Jannar-Settembru 2019" 73285 togħrok. jew 3053,542 rublu/jum. Għaldaqstant, niksbu valur kritiku ugwali għal:
3053,542: 12,2 = 250,4 unitajiet ta 'rekords.

Dan ifisser, mil-lat soċjali, jekk tester ivverifika 251 rekord u sab żball wieħed, huwa ekwivalenti li l-utent jiffissa dan l-iżball hu stess. Għaldaqstant, jekk it-tester qatta 'ħin ugwali għall-iċċekkjar ta' 252 rekord biex isib l-iżball li jmiss, allura f'dan il-każ huwa aħjar li l-ispiża tal-korrezzjoni tiġi ċċarata lill-utent.

Approċċ simplifikat huwa ppreżentat hawnhekk, peress li mil-lat soċjali huwa meħtieġ li jittieħed kont tal-valur addizzjonali kollu ġġenerat minn kull speċjalista, jiġifieri, l-ispejjeż inklużi t-taxxi u l-pagamenti soċjali, iżda l-mudell huwa ċar. Konsegwenza ta 'din ir-relazzjoni hija r-rekwiżit li ġej għall-ispeċjalisti: speċjalista mill-industrija tal-IT għandu jkollu salarju akbar mill-medja nazzjonali. Jekk is-salarju tiegħu huwa inqas mis-salarju medju ta 'utenti potenzjali tad-database, allura hu stess irid jiċċekkja id-database kollha id-data ma' id.

Meta tuża l-kriterju deskritt, l-ewwel rekwiżit għall-kwalità tad-database huwa ffurmat:
I(tr). Is-sehem ta 'żbalji kritiċi m'għandux jaqbeż 1/250,4 = 0,39938%. Ftit inqas minn raffinar deheb fl-industrija. U f'termini fiżiċi m'hemmx aktar minn 1459 rekord bi żbalji.

Irtir ekonomiku.

Fil-fatt, billi tagħmel tali numru ta’ żbalji fir-rekords, is-soċjetà taqbel ma’ telf ekonomiku fl-ammont ta’:

1459 * 3053,542 = 4 rublu.

Dan l-ammont huwa determinat mill-fatt li s-soċjetà m'għandhiex l-għodda biex tnaqqas dawn l-ispejjeż. Minn dan isegwi li jekk xi ħadd ikollu teknoloġija li tippermettilhom inaqqas in-numru ta 'rekords bi żbalji għal, pereżempju, 259, allura dan jippermetti lis-soċjetà tiffranka:
1200 * 3053,542 = 3 rublu.

Iżda fl-istess ħin, jista 'jitlob għat-talent u x-xogħol tiegħu, ukoll, ejja ngħidu - 1 miljun rublu.
Jiġifieri, l-ispejjeż soċjali jitnaqqsu minn:

3 – 664 = 250 rublu.

Essenzjalment, dan l-effett huwa l-valur miżjud mill-użu tat-teknoloġiji BigDat.

Iżda hawnhekk għandu jitqies li dan huwa effett soċjali, u s-sid tad-database huwa awtoritajiet muniċipali, id-dħul tagħhom mill-użu ta 'proprjetà rreġistrata f'din id-database, b'rata ta' 0,3%, huwa: 2,778 biljun rublu/ sena. U dawn l-ispejjeż (4 rublu) ma tantx jolqtuh, peress li huma trasferiti lis-sidien tal-proprjetà. U, f'dan l-aspett, l-iżviluppatur ta 'aktar teknoloġiji ta' raffinar fil-Bigdata se jkollu juri l-abbiltà li jikkonvinċi lis-sid ta 'din id-database, u affarijiet bħal dawn jeħtieġu talent konsiderevoli.

F'dan l-eżempju, l-algoritmu tal-valutazzjoni tal-iżball intgħażel abbażi tal-mudell Schumann [2] tal-verifika tas-softwer waqt l-ittestjar tal-affidabbiltà. Minħabba l-prevalenza tagħha fuq l-Internet u l-abbiltà li tikseb l-indikaturi statistiċi meħtieġa. Il-metodoloġija hija meħuda minn Monakhov Yu.M. "Stabbiltà funzjonali tas-sistemi ta 'informazzjoni", ara taħt l-ispoiler fil-Fig. 7-9.

Ross. 7 – 9 Metodoloġija tal-mudell SchumannNaddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku

It-tieni parti ta 'dan il-materjal tippreżenta eżempju ta' tindif tad-dejta, li fih jinkisbu r-riżultati tal-użu tal-mudell Schumann.
Ħa nippreżenta r-riżultati miksuba:
Numru stmat ta' żbalji N = 3167 n.
Parametru C, lambda u funzjoni ta' affidabilità:

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 1. Teoretiku
Fig. 17

Essenzjalment, il-lambda hija indikatur attwali tal-intensità li biha jinstabu żbalji f'kull stadju. Jekk tħares lejn it-tieni parti, l-istima għal dan l-indikatur kienet 42,4 żbalji fis-siegħa, li hija pjuttost komparabbli mal-indikatur Schumann. Hawn fuq, ġie determinat li r-rata li biha l-iżviluppaturi jsibu żbalji m'għandhiex tkun inqas minn żball 1 għal kull 250,4 rekords, meta jiċċekkjaw rekord 1 kull minuta. Għalhekk il-valur kritiku tal-lambda għall-mudell Schumann:

60 / 250,4 = 0,239617.

Jiġifieri, il-ħtieġa li jitwettqu proċeduri ta 'sejbien ta' żbalji trid titwettaq sakemm lambda, mit-38,964 eżistenti, tonqos għal 0,239617.

Jew sakemm l-indikatur N (numru potenzjali ta 'żbalji) nieqes n (numru korrett ta' żbalji) jonqos taħt il-limitu aċċettat tagħna - 1459 pcs.

Letteratura

  1. Monakhov, Yu. M. Stabbiltà funzjonali tas-sistemi tal-informazzjoni. F'sigħat 3. Parti 1. Affidabbiltà tas-softwer: ktieb tat-test. allowance / Yu. M. Monakhov; Vladim. Stat univ. – Vladimir: Izvo Vladim. Stat Università, 2011. – 60 p. – ISBN 978-5-9984-0189-3.
  2. Martin L. Shooman, "Mudelli probabilistiċi għat-tbassir tal-affidabbiltà tas-softwer."
  3. Fundamenti tal-magazzinaġġ tad-dejta għall-professjonisti tal-IT / Paulraj Ponniah.—2nd ed.

It-tieni parti. Teoretiku

Sors: www.habr.com

Żid kumment