Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

В l-ewwel parti ġie deskritt li din il-pubblikazzjoni saret fuq il-bażi ta 'sett ta' dejta ta 'riżultati ta' valutazzjoni katastali ta 'proprjetà immobbli fl-Okrug Awtonomu Khanty-Mansi.

Il-parti prattika hija ppreżentata fil-forma ta 'passi. It-tindif kollu sar f'Excel, peress li l-aktar għodda komuni u l-operazzjonijiet deskritti jistgħu jiġu ripetuti minn ħafna speċjalisti li jafu Excel. U pjuttost adattat tajjeb għal xogħol bl-idejn.

L-istadju żero se jkun ix-xogħol tat-tnedija u l-iffrankar tal-fajl, peress li huwa ta 'daqs ta' 100 MB, imbagħad bin-numru ta 'dawn l-operazzjonijiet ikun għexieren u mijiet, jieħdu ħin sinifikanti.
Il-ftuħ, bħala medja, huwa ta '30 sekonda.
Iffrankar - 22 sek.

L-ewwel stadju jibda bid-determinazzjoni tal-indikaturi statistiċi tas-sett tad-dejta.

Tabella 1. Indikaturi statistiċi tas-sett tad-dejta
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

Teknoloġija 2.1.

Aħna noħolqu qasam awżiljarju, għandi taħt in-numru - AY. Għal kull entrata, aħna niffurmaw il-formula “= TUL (F365502)+ TUL (G365502)+…+ TUL (AW365502)”

Ħin totali mqatta' fuq l-istadju 2.1 (għall-formula Schumann) t21 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 2.1 (għall-formula Schumann) n21 = 0 pcs.

It-tieni stadju.
Iċċekkjar tal-komponenti tas-sett tad-dejta.
2.2. Il-valuri kollha fir-rekords huma ffurmati bl-użu ta 'simboli standard. Għalhekk, ejja nsegwu l-istatistika bis-simboli.

Tabella 2. Indikaturi statistiċi ta' karattri fis-sett tad-dejta b'analiżi preliminari tar-riżultati.Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

Teknoloġija 2.2.1.

Aħna noħolqu qasam awżiljarju - "alpha1". Għal kull rekord, aħna niffurmaw il-formula “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Noħolqu ċellula Omega-1 fissa. Aħna se ndaħħlu alternattivament kodiċijiet ta 'karattri skond Windows-1251 minn 32 sa 255 f'din iċ-ċellula.
Aħna noħolqu qasam awżiljarju - "alpha2". Bil-formula "= FIND(SYMBOL(Omega,1); "alpha1",N)".
Aħna noħolqu qasam awżiljarju - "alpha3". Bil-formula “=IF(ISNUMBER(“alpha2”,N),1)”
Oħloq ċellula fissa "Omega-2", bil-formula "=SUM ("alpha3"N1: "alpha3"N365498)"

Tabella 3. Riżultati tal-analiżi preliminari tar-riżultatiNaddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

Tabella 4. Żbalji rreġistrati f'dan l-istadjuNaddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

Ħin totali mqatta' fuq l-istadju 2.2.1 (għall-formula Schumann) t221 = siegħa.
Numru ta 'żbalji kkoreġuti fl-istadju 2.2.1 (għall-formula Schumann) n221 = 0 pcs.

Pass 3.
It-tielet pass huwa li jirreġistra l-istat tad-dataset. Billi tassenja lil kull rekord numru uniku (ID) u kull field. Dan huwa meħtieġ biex iqabbel is-sett tad-dejta kkonvertit ma 'dak oriġinali. Dan huwa wkoll meħtieġ biex jittieħed vantaġġ sħiħ mill-kapaċitajiet ta 'raggruppament u filtrazzjoni. Hawnhekk għal darb'oħra ngħaddu għat-tabella 2.2.2 u nagħżlu simbolu li ma jintużax fid-dataset. Ikollna dak li jidher fil-Figura 10.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 10. Assenjazzjoni ta' identifikaturi.

Ħin totali mqatta' fuq l-istadju 3 (għall-formula Schumann) t3 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 3 (għall-formula Schumann) n3 = 0 pcs.

Peress li l-formula Schumann teħtieġ li l-istadju jitlesta billi jiġu kkoreġuti l-iżbalji. Ejja nerġgħu lura għall-istadju 2.

Pass 2.2.2.
F'dan il-pass se nikkoreġu wkoll spazji doppji u tripli.
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 11. Numru ta' spazji doppji.

Korrezzjoni ta' żbalji identifikati fit-tabella 2.2.4.

Tabella 5. Stadju tal-korrezzjoni tal-iżbaljiNaddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

Eżempju ta’ għaliex aspett bħal dan bħall-użu tal-ittri “e” jew “e” huwa sinifikanti huwa ppreżentat fil-Figura 12.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 12. Diskrepanza fl-ittra "e".

Ħin totali mgħoddi fil-pass 2.2.2 t222 = 4 sigħat.
Numru ta 'żbalji misjuba fl-istadju 2.2.2 (għall-formula Schumann) n222 = 583 pcs.

Ir-raba’ stadju.
Iċċekkjar għal redundancy fuq il-post jidħol sew f'dan l-istadju. Mill-44 qasam, 6 oqsma:
7 - Għan tal-istruttura
16 — Numru ta' sulari taħt l-art
17 - Oġġett ġenitur
21 - Kunsill tar-raħal
38 — Parametri tal-istruttura (deskrizzjoni)
40 – Wirt kulturali

Huma m'għandhom l-ebda daħliet. Jiġifieri huma żejda.
Il-qasam “22 – Belt” għandu entrata waħda, Figura 13.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 13. L-unika daħla hija Z_348653 fil-qasam "Belt".

Field “34 - Isem tal-bini” fih entrati li b'mod ċar ma jikkorrispondux mal-iskop tal-field, Figura 14.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 14. Eżempju ta' dħul mhux konformi.

Aħna neskludu dawn l-oqsma mis-sett tad-dejta. U nirreġistraw il-bidla f'214-il rekord.

Ħin totali mqatta' fuq l-istadju 4 (għall-formula Schumann) t4 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 4 (għall-formula Schumann) n4 = 222 pcs.

Tabella 6. Analiżi tal-indikaturi tas-sett tad-dejta wara r-4 stadju

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku

B'mod ġenerali, meta janalizzaw il-bidliet fl-indikaturi (Tabella 6) nistgħu ngħidu li:
1) Il-proporzjon tan-numru medju ta 'simboli mal-lieva tad-devjazzjoni standard huwa qrib it-3, jiġifieri, hemm sinjali ta' distribuzzjoni normali (regola ta 'sitt sigma).
2) Devjazzjoni sinifikanti tal-lievi minimi u massimi mill-lieva medja tissuġġerixxi li l-istudju tad-dnub huwa direzzjoni promettenti meta tfittex żbalji.

Ejja neżaminaw ir-riżultati tas-sejba ta 'żbalji bl-użu tal-metodoloġija ta' Schumann.

Stadji inattivi

2.1. Ħin totali mqatta' fuq l-istadju 2.1 (għall-formula Schumann) t21 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 2.1 (għall-formula Schumann) n21 = 0 pcs.

3. Ħin totali mqatta' fuq l-istadju 3 (għall-formula Schumann) t3 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 3 (għall-formula Schumann) n3 = 0 pcs.

Stadji effettivi
2.2. Ħin totali mqatta' fuq l-istadju 2.2.1 (għall-formula Schumann) t221 = siegħa.
Numru ta 'żbalji kkoreġuti fl-istadju 2.2.1 (għall-formula Schumann) n221 = 0 pcs.
Ħin totali mgħoddi fil-pass 2.2.2 t222 = 4 sigħat.
Numru ta 'żbalji misjuba fl-istadju 2.2.2 (għall-formula Schumann) n222 = 583 pcs.

Ħin totali mgħoddi fil-pass 2.2 t22 = 8 + 4 = 12-il siegħa.
Numru ta 'żbalji misjuba fl-istadju 2.2.2 (għall-formula Schumann) n222 = 583 pcs.

4. Ħin totali mqatta' fuq l-istadju 4 (għall-formula Schumann) t4 = siegħa.
Numru ta 'żbalji misjuba fl-istadju 4 (għall-formula Schumann) n4 = 222 pcs.

Peress li hemm żero stadji li jridu jiġu inklużi fl-ewwel stadju tal-mudell Schumann, u min-naħa l-oħra, l-istadji 2.2 u 4 huma intrinsikament indipendenti, allura minħabba li l-mudell Schumann jassumi li billi jżid it-tul tal-kontroll, il-probabbiltà ta 'l-iskoperta ta' żball jonqos, jiġifieri, il-fluss inaqqas il-fallimenti, imbagħad billi neżaminaw dan il-fluss aħna niddeterminaw liema stadju npoġġu l-ewwel, skont ir-regola, fejn id-densità tal-falliment hija aktar frekwenti, aħna npoġġu dak l-istadju l-ewwel.

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 15.

Mill-formula fil-Figura 15 jirriżulta li huwa preferibbli li r-raba' stadju jitqiegħed qabel l-istadju 2.2 fil-kalkoli.

Bl-użu tal-formula ta’ Schumann, niddeterminaw in-numru inizjali stmat ta’ żbalji:

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 16.

Mir-riżultati fil-Figura 16 wieħed jista 'jara li n-numru previst ta' żbalji huwa N2 = 3167, li huwa aktar mill-kriterju minimu ta '1459.

Bħala riżultat tal-korrezzjoni, ikkoreġejna 805 żbalji, u n-numru previst huwa 3167 – 805 = 2362, li għadu aktar mil-limitu minimu li aċċettajna.

Aħna niddefinixxu l-parametru C, il-lambda u l-funzjoni tal-affidabbiltà:

Naddaf id-dejta bħal logħba tal-blat, karta, imqass. Din hija logħba bi tmiem jew mingħajr? Parti 2. Prattiku
Fig. 17.

Essenzjalment, il-lambda hija indikatur attwali tal-intensità li biha jinstabu żbalji f'kull stadju. Jekk tħares hawn fuq, l-istima preċedenti ta 'dan l-indikatur kienet 42,4 żbalji fis-siegħa, li hija pjuttost komparabbli mal-indikatur Schumann. Meta ddur għall-ewwel parti ta 'dan il-materjal, ġie determinat li r-rata li biha żviluppatur isib żbalji m'għandhiex tkun inqas minn żball 1 għal kull 250,4 rekords, meta jiċċekkja rekord 1 kull minuta. Għalhekk il-valur kritiku tal-lambda għall-mudell Schumann:
60 / 250,4 = 0,239617.

Jiġifieri, il-ħtieġa li jitwettqu proċeduri ta 'sejbien ta' żbalji trid titwettaq sakemm lambda, mit-38,964 eżistenti, tonqos għal 0,239617.

Jew sakemm l-indikatur N (numru potenzjali ta 'żbalji) nieqes n (numru korrett ta' żbalji) jonqos taħt il-limitu li aċċettajna (fl-ewwel parti) - 1459 pcs.

Parti 1. Teoretiku.

Sors: www.habr.com

Żid kumment