Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

В Deel een dit is beskryf dat hierdie publikasie gemaak is op grond van 'n datastel van die resultate van 'n kadastrale waardasie van vaste eiendom in die Khanty-Mansi Outonome Okrug.

Die praktiese deel word in die vorm van stappe aangebied. Alle skoonmaak is in Excel uitgevoer, aangesien die mees algemene instrument en die beskryfde bewerkings herhaal kan word deur die meeste spesialiste wat Excel ken. En baie geskik vir hand-tot-hand werk.

Die nul-fase sal die werk wees om die lêer te begin, stoor, aangesien dit 100 mb groot is, dan neem dit met die aantal van hierdie bewerkings, tiene en honderde, 'n aansienlike hoeveelheid tyd.
Opening, gemiddeld, - 30 sekondes.
Spaar - 22 sek.

Die eerste fase begin met die bepaling van die statistiese aanwysers van die datastel.

Tabel 1. Datastelstatistieke
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

Tegnologie 2.1.

Ons skep 'n hulpveld, ek het dit onder die nommer - AY. Vir elke inskrywing vorm ons die formule "= DLSTR (F365502) + DLSTR (G365502) + ... + DLSTR (AW365502)"

Die totale tyd spandeer aan stap 2.1 (vir die Schumann-formule) t21 = 1 uur.
Die aantal foute gevind by stadium 2.1 (vir die Schumann-formule) n21 = 0 st.

Tweede fase.
Kontroleer datastelkomponente.
2.2. Alle waardes in rekords word gevorm deur standaardkarakters. Daarom sal ons die statistieke deur simbole dop.

Tabel 2. Karakterstatistieke in die datastel met 'n voorlopige ontleding van die resultate.Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

Tegnologie 2.2.1.

Skep 'n hulpveld - "alpha1". Vir elke rekord vorm ons die formule "=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)"
Ons skep 'n vaste sel "Omega-1". In hierdie sel sal ons afwisselend karakterkodes vir Windows-1251 van 32 tot 255 invoer.
Skep 'n hulpveld - "alpha2". Met die formule "= FIND (CHAR (Omega, 1), "alpha1", N)".
Ons skep 'n hulpveld - "alpha3". Met die formule “=IF(ISNUMBER(“alpha2”,N),1)”
Skep 'n vaste sel "Omega-2", met die formule "=SOM("alpha3"N1:"alpha3"N365498)"

Tabel 3. Resultate van die voorlopige ontleding van die resultateMaak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

Tabel 4. Vaste foute op hierdie stadiumMaak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

Die totale tyd spandeer aan stap 2.2.1 (vir die Schumann-formule) t221 = 8 uur.
Die aantal gekorrigeerde foute by stadium 2.2.1 (vir die Schumann-formule) n221 = 0 st.

Stadium 3.
Die derde stap is om die toestand van die datastel reg te stel. Deur aan elke rekord 'n unieke nommer (ID) en elke veld toe te ken. Dit is nodig om die omgeskakelde datastel met die oorspronklike een te vergelyk. Dit is ook nodig om die moontlikhede van groepering en filtering ten volle te gebruik. Hier gaan ons weer na tabel 2.2.2 en kies 'n simbool wat nie in die datastel gebruik word nie. Ons kry wat in Figuur 10 getoon word.

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig.10. Toewysing van identifiseerders.

Die totale tyd spandeer aan stap 3 (vir die Schumann-formule) t3 = 0,75 uur.
Die aantal foute gevind by stadium 3 (vir die Schumann-formule) n3 = 0 st.

Aangesien die Schumann-formule vereis dat die stadium voltooi word deur foute reg te stel. Ons keer terug na fase 2.

Stadium 2.2.2.
In hierdie stap sal ons ook dubbel- en drievoudige spasies regstel.
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig.11. Die aantal dubbelspasies.

Regstelling van foute wat in Tabel 2.2.4 geïdentifiseer is.

Tabel 5. FoutkorreksiefaseMaak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

’n Voorbeeld van hoekom so ’n aspek soos die gebruik van die letters “e” of “ё” betekenisvol is, word in Figuur 12 getoon.

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig.12. Mismatch op die letter "e".

Totale tyd spandeer in stap 2.2.2 t222 = 4 uur.
Die aantal foute gevind by stadium 2.2.2 (vir die Schumann-formule) n222 = 583 st.

Vierde stadium.
Kontroleer vir oortolligheid van velde pas goed in hierdie stadium. Uit 44 velde 6 velde:
7 - Doel van die struktuur
16 - Aantal ondergrondse vloere
17 - Ouervoorwerp
21 - Dorpsraad
38 - Struktuurparameters (beskrywing)
40 - Kulturele erfenis

Hulle het geen rekords nie. Dit wil sê, oorbodig.
Die veld "22 - Stad" het een enkele inskrywing, Figuur 13.

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig.13. Die enigste inskrywing is Z_348653 in die "Stad"-veld.

Veld “34 - Gebounaam” bevat inskrywings wat duidelik nie ooreenstem met die doel van die veld nie, Figuur 14.

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig.14. 'n Voorbeeld van 'n nie-ooreenstemmende inskrywing.

Ons sluit hierdie velde uit van die datastel. Ons maak ook verandering van 214 rekords reg.

Die totale tyd spandeer aan stap 4 (vir die Schumann-formule) t4 = 2,5 uur.
Die aantal foute gevind by stadium 4 (vir die Schumann-formule) n4 = 222 st.

Tabel 6. Ontleding van datastel-aanwysers na die 4de stadium

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties

In die algemeen, as ons die veranderinge in aanwysers (Tabel 6) ontleed, kan ons sê dat:
1) Die hefboomverhouding van die gemiddelde aantal simbole tot die standaardafwyking hefboomfinansiering is naby aan 3, dit wil sê, daar is tekens van 'n normale verspreiding (ses sigma-reël).
2) 'n Beduidende afwyking van die minimum en maksimum hefbome van die gemiddelde hefboom dui daarop dat die studie van sterte 'n belowende rigting is in die soeke na foute.

Ons ondersoek die resultate van die vind van foute deur die Schumann-metodologie te gebruik.

ledige stadiums

2.1. Die totale tyd spandeer aan stap 2.1 (vir die Schumann-formule) t21 = 1 uur.
Die aantal foute gevind by stadium 2.1 (vir die Schumann-formule) n21 = 0 st.

3. Die totale tyd spandeer aan stap 3 (vir die Schumann-formule) t3 = 0,75 uur.
Die aantal foute gevind by stadium 3 (vir die Schumann-formule) n3 = 0 st.

Effektiewe stadiums
2.2. Die totale tyd spandeer aan stap 2.2.1 (vir die Schumann-formule) t221 = 8 uur.
Die aantal gekorrigeerde foute by stadium 2.2.1 (vir die Schumann-formule) n221 = 0 st.
Totale tyd spandeer in stap 2.2.2 t222 = 4 uur.
Die aantal foute gevind by stadium 2.2.2 (vir die Schumann-formule) n222 = 583 st.

Totale tyd spandeer in stap 2.2 t22 = 8 + 4 = 12 uur.
Die aantal foute gevind by stadium 2.2.2 (vir die Schumann-formule) n222 = 583 st.

4. Die totale tyd spandeer aan stap 4 (vir die Schumann-formule) t4 = 2,5 uur.
Die aantal foute gevind by stadium 4 (vir die Schumann-formule) n4 = 222 st.

Aangesien daar geen stadiums is wat by die eerste stadium van die Schumann-model ingesluit moet word, en aan die ander kant, is stadiums 2.2 en 4 inherent onafhanklik, aangesien die Schuman-model aanvaar dat 'n toename in die duur van die tjek, die waarskynlikheid van die opsporing van 'n fout neem af, dit wil sê die vloeimislukkings, dan sal ons deur hierdie vloei te ondersoek bepaal watter van die stadiums eerste geplaas moet word, volgens die reël, waar die mislukkingsdigtheid meer gereeld is, plaas ons een van die stadiums eerste .

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig. 15.

Dit volg uit die formule in Figuur 15 dat dit verkieslik is om die vierde stadium voor stadium 2.2 in die berekeninge te plaas.

Deur die Schumann-formule te gebruik, bepaal ons die beraamde aanvanklike aantal foute:

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig. 16.

Uit die resultate in Figuur 16 kan gesien word dat die voorspelde aantal foute N2 = 3167, wat meer as die minimum kriterium van 1459 is.

As gevolg van die regstelling het ons 805 foute reggestel, en die voorspelde getal is 3167 - 805 = 2362, wat steeds meer is as die minimum drempel wat deur ons aanvaar is.

Ons definieer parameter C, lambda en betroubaarheidsfunksie:

Maak data soos rots, papier, skêr skoon. Is dit 'n speletjie met of sonder 'n afronding? Deel 2. Prakties
Fig. 17.

In wese is lambda die werklike tempo waarteen foute in elke stadium opgespoor word. As jy hierbo kyk, was die skatting van hierdie aanwyser vroeër 42,4 foute per uur, wat redelik vergelykbaar is met die Schuman-aanwyser. Met verwysing na die eerste deel van hierdie materiaal, is vasgestel dat die tempo van die vind van foute deur die ontwikkelaar nie laer as 1 fout per 250,4 rekords moet wees wanneer 1 rekord per minuut nagegaan word nie. Vandaar die kritieke lambda-waarde vir die Schumann-model:
60 / 250,4 = 0,239617.

Dit wil sê, die behoefte om die prosedures uit te voer om foute te vind, moet uitgevoer word totdat die lambda, vanaf die beskikbare 38,964, tot 0,239617 daal.

Of totdat die aanwyser N (potensiële aantal foute) minus n (gekorrigeerde aantal foute) daal onder die drempel wat ons aangeneem het (in die eerste deel) - 1459 stuks.

Deel 1. Teoreties.

Bron: will.com

Voeg 'n opmerking