Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

В esimene osa kirjeldati, et käesolev väljaanne on tehtud Hantõ-Mansi autonoomse ringkonna kinnisvara katastrihindamise tulemuste andmestiku alusel.

Praktiline osa on esitatud sammude kujul. Kogu puhastus tehti Excelis, kuna enamlevinud tööriista ja kirjeldatud toiminguid saavad enamus Exceli tundvaid spetsialiste korrata. Ja sobib päris hästi käest kätte töötamiseks.

Null-etapp on faili käivitamine ja salvestamine, kuna see on 100 MB suurune, siis nende toimingute arvuga kümneid ja sadu kuluvad need märkimisväärselt aega.
Avamine on keskmiselt 30 sekundit.
Säästmine – 22 sek.

Esimene etapp algab andmekogumi statistiliste näitajate määramisega.

Tabel 1. Andmestiku statistilised näitajad
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Tehnoloogia 2.1.

Loome abivälja, mul on see numbri all - AY. Iga kirje jaoks moodustame valemi „=PIKKUS(F365502)+PIKKUS(G365502)+…+PIKKUS(AW365502)”

Laval 2.1 veedetud aeg kokku (Schumanni valemi jaoks) t21 = 1 tund.
Etapil 2.1 leitud vigade arv (Schumanni valemi jaoks) n21 = 0 tk.

Teises etapis.
Andmestiku komponentide kontrollimine.
2.2. Kõik kirjete väärtused moodustatakse standardsete sümbolite abil. Seetõttu jälgime statistikat sümbolite järgi.

Tabel 2. Andmestiku märkide statistilised näitajad koos tulemuste eelanalüüsiga.Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Tehnoloogia 2.2.1.

Loome abivälja - “alpha1”. Iga kirje jaoks moodustame valemi “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Loome fikseeritud Omega-1 raku. Sellesse lahtrisse sisestame vaheldumisi märgikoodid vastavalt Windows-1251-le vahemikus 32 kuni 255.
Loome abivälja - "alpha2". Valemiga “=LEIA(SYMBOL(Omega,1); “alpha1”,N)”.
Loome abivälja - “alpha3”. Valemiga "=IF(ISNUMBER("alfa2",N),1)
Looge fikseeritud lahter "Omega-2" valemiga "=SUM("alpha3"N1: "alpha3"N365498)"

Tabel 3. Tulemuste eelanalüüsi tulemusedAndmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Tabel 4. Selles etapis registreeritud veadAndmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Laval 2.2.1 veedetud aeg kokku (Schumanni valemi jaoks) t221 = 8 tund.
Parandatud vigade arv etapis 2.2.1 (Schumanni valemi jaoks) n221 = 0 tk.

Samm 3.
Kolmas samm on andmestiku oleku salvestamine. Määrates igale kirjele kordumatu numbri (ID) ja igale väljale. See on vajalik teisendatud andmekogumi võrdlemiseks algse andmekogumiga. See on vajalik ka rühmitamis- ja filtreerimisvõimaluste täielikuks ärakasutamiseks. Siin pöördume taas tabeli 2.2.2 poole ja valime sümboli, mida andmekogumis ei kasutata. Saame seda, mis on näidatud joonisel 10.

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 10. Identifikaatorite määramine.

Laval 3 veedetud aeg kokku (Schumanni valemi jaoks) t3 = 0,75 tund.
Etapil 3 leitud vigade arv (Schumanni valemi jaoks) n3 = 0 tk.

Kuna Schumanni valem nõuab etapi lõpetamist vigade parandamisega. Tuleme tagasi 2. etapi juurde.

Samm 2.2.2.
Selles etapis parandame ka kahe- ja kolmekordseid tühikuid.
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 11. Kahekordsete tühikute arv.

Tabelis 2.2.4 tuvastatud vigade parandamine.

Tabel 5. Veaparanduse etappAndmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Näide, miks selline aspekt nagu tähtede “e” või “e” kasutamine oluline on, on toodud joonisel 12.

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 12. Lahknevus tähes "e".

Sammus 2.2.2 kulutatud aeg kokku t222 = 4 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.

Neljas etapp.
Sellesse etappi sobib hästi välja koondamise kontrollimine. 44 väljast 6 välja:
7 - Struktuuri eesmärk
16 — maa-aluste korruste arv
17 - Vanemobjekt
21 - Külanõukogu
38 – Struktuuriparameetrid (kirjeldus)
40 – Kultuuripärand

Neil pole ühtegi kirjet. See tähendab, et need on üleliigsed.
Väljal „22 – Linn” on üks kirje, joonis 13.

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 13. Ainus kanne on väljal "Linn" Z_348653.

Väli “34 – Hoone nimi” sisaldab kirjeid, mis selgelt ei vasta välja otstarbele, Joonis 14.

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 14. Näide nõuetele mittevastavast kandest.

Jätame need väljad andmekogumist välja. Ja me registreerime muutuse 214 kirjes.

Laval 4 veedetud aeg kokku (Schumanni valemi jaoks) t4 = 2,5 tund.
Etapil 4 leitud vigade arv (Schumanni valemi jaoks) n4 = 222 tk.

Tabel 6. Andmekogumi näitajate analüüs pärast 4. etappi

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline

Üldiselt võib näitajate muutusi analüüsides (tabel 6) öelda, et:
1) Keskmise sümbolite arvu ja standardhälbe kangi suhe on 3-le lähedane ehk on normaaljaotuse tunnused (kuue sigma reegel).
2) Minimaalse ja maksimaalse hoova oluline kõrvalekalle keskmisest kangist viitab sellele, et sabade uurimine on vigade otsimisel paljulubav suund.

Uurime Schumanni metoodikat kasutades vigade leidmise tulemusi.

Tühikäigu etapid

2.1. Laval 2.1 veedetud aeg kokku (Schumanni valemi jaoks) t21 = 1 tund.
Etapil 2.1 leitud vigade arv (Schumanni valemi jaoks) n21 = 0 tk.

3. Laval 3 veedetud aeg kokku (Schumanni valemi jaoks) t3 = 0,75 tund.
Etapil 3 leitud vigade arv (Schumanni valemi jaoks) n3 = 0 tk.

Tõhusad etapid
2.2. Laval 2.2.1 veedetud aeg kokku (Schumanni valemi jaoks) t221 = 8 tund.
Parandatud vigade arv etapis 2.2.1 (Schumanni valemi jaoks) n221 = 0 tk.
Sammus 2.2.2 kulutatud aeg kokku t222 = 4 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.

Etapis 2.2 kulunud aeg kokku t22 = 8 + 4 = 12 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.

4. Laval 4 veedetud aeg kokku (Schumanni valemi jaoks) t4 = 2,5 tund.
Etapil 4 leitud vigade arv (Schumanni valemi jaoks) n4 = 222 tk.

Kuna Schumanni mudeli esimesse etappi tuleb lisada nulletappe ja teisest küljest on etapid 2.2 ja 4 oma olemuselt sõltumatud, siis arvestades, et Schumanni mudel eeldab, et suurendades kontrolli kestust, suureneb tõenäosus. vea tuvastamine väheneb, st voog vähendab rikkeid, siis seda voogu uurides teeme kindlaks, milline etapp asetada esimeseks, reegli järgi, kus rikketihedus on sagedasem, asetame selle etapi esimeseks.

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 15.

Joonisel 15 olevast valemist järeldub, et arvutustes on eelistatav asetada neljas etapp enne etappi 2.2.

Schumanni valemi abil määrame hinnangulise esialgse vigade arvu:

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 16.

Joonise 16 tulemustest on näha, et prognoositav vigade arv on N2 = 3167, mis on rohkem kui miinimumkriteerium 1459.

Paranduse tulemusena parandasime 805 viga ja prognoositud arv on 3167 – 805 = 2362, mis on siiski rohkem kui meie aktsepteeritud miinimumlävi.

Määratleme parameetri C, lambda ja töökindlusfunktsiooni:

Andmete, nagu kivi, paber, käärid, puhastamine. Kas see on mäng viimistlusega või ilma? Osa 2. Praktiline
Joonis 17.

Põhimõtteliselt on lambda igas etapis vigade tuvastamise intensiivsuse tegelik näitaja. Kui ülalt vaadata, siis eelmine hinnang sellele näitajale oli 42,4 viga tunnis, mis on üsna võrreldav Schumanni näitajaga. Selle materjali esimese osa poole pöördudes tehti kindlaks, et 1 kirje kontrollimisel minutis ei tohiks arendaja vigade leidmise määr olla väiksem kui 250,4 viga 1 kirje kohta. Siit tuleneb lambda kriitiline väärtus Schumanni mudeli jaoks:
60 / 250,4 = 0,239617.

See tähendab, et vigade tuvastamise protseduuride läbiviimise vajadus tuleb läbi viia seni, kuni lambda väheneb olemasolevalt 38,964-lt väärtusele 0,239617.

Või kuni indikaator N (potentsiaalne vigade arv) miinus n (parandatud vigade arv) langeb allapoole meie aktsepteeritud läve (esimeses osas) - 1459 tk.

Osa 1. Teoreetiline.

Allikas: www.habr.com

Lisa kommentaar