В
Praktiline osa on esitatud sammude kujul. Kogu puhastus tehti Excelis, kuna enamlevinud tööriista ja kirjeldatud toiminguid saavad enamus Exceli tundvaid spetsialiste korrata. Ja sobib päris hästi käest kätte töötamiseks.
Null-etapp on faili käivitamine ja salvestamine, kuna see on 100 MB suurune, siis nende toimingute arvuga kümneid ja sadu kuluvad need märkimisväärselt aega.
Avamine on keskmiselt 30 sekundit.
Säästmine – 22 sek.
Esimene etapp algab andmekogumi statistiliste näitajate määramisega.
Tabel 1. Andmestiku statistilised näitajad
Tehnoloogia 2.1.
Loome abivälja, mul on see numbri all - AY. Iga kirje jaoks moodustame valemi „=PIKKUS(F365502)+PIKKUS(G365502)+…+PIKKUS(AW365502)”
Laval 2.1 veedetud aeg kokku (Schumanni valemi jaoks) t21 = 1 tund.
Etapil 2.1 leitud vigade arv (Schumanni valemi jaoks) n21 = 0 tk.
Teises etapis.
Andmestiku komponentide kontrollimine.
2.2. Kõik kirjete väärtused moodustatakse standardsete sümbolite abil. Seetõttu jälgime statistikat sümbolite järgi.
Tabel 2. Andmestiku märkide statistilised näitajad koos tulemuste eelanalüüsiga.
Tehnoloogia 2.2.1.
Loome abivälja - “alpha1”. Iga kirje jaoks moodustame valemi “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Loome fikseeritud Omega-1 raku. Sellesse lahtrisse sisestame vaheldumisi märgikoodid vastavalt Windows-1251-le vahemikus 32 kuni 255.
Loome abivälja - "alpha2". Valemiga “=LEIA(SYMBOL(Omega,1); “alpha1”,N)”.
Loome abivälja - “alpha3”. Valemiga "=IF(ISNUMBER("alfa2",N),1)
Looge fikseeritud lahter "Omega-2" valemiga "=SUM("alpha3"N1: "alpha3"N365498)"
Tabel 3. Tulemuste eelanalüüsi tulemused
Tabel 4. Selles etapis registreeritud vead
Laval 2.2.1 veedetud aeg kokku (Schumanni valemi jaoks) t221 = 8 tund.
Parandatud vigade arv etapis 2.2.1 (Schumanni valemi jaoks) n221 = 0 tk.
Samm 3.
Kolmas samm on andmestiku oleku salvestamine. Määrates igale kirjele kordumatu numbri (ID) ja igale väljale. See on vajalik teisendatud andmekogumi võrdlemiseks algse andmekogumiga. See on vajalik ka rühmitamis- ja filtreerimisvõimaluste täielikuks ärakasutamiseks. Siin pöördume taas tabeli 2.2.2 poole ja valime sümboli, mida andmekogumis ei kasutata. Saame seda, mis on näidatud joonisel 10.
Joonis 10. Identifikaatorite määramine.
Laval 3 veedetud aeg kokku (Schumanni valemi jaoks) t3 = 0,75 tund.
Etapil 3 leitud vigade arv (Schumanni valemi jaoks) n3 = 0 tk.
Kuna Schumanni valem nõuab etapi lõpetamist vigade parandamisega. Tuleme tagasi 2. etapi juurde.
Samm 2.2.2.
Selles etapis parandame ka kahe- ja kolmekordseid tühikuid.
Joonis 11. Kahekordsete tühikute arv.
Tabelis 2.2.4 tuvastatud vigade parandamine.
Tabel 5. Veaparanduse etapp
Näide, miks selline aspekt nagu tähtede “e” või “e” kasutamine oluline on, on toodud joonisel 12.
Joonis 12. Lahknevus tähes "e".
Sammus 2.2.2 kulutatud aeg kokku t222 = 4 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.
Neljas etapp.
Sellesse etappi sobib hästi välja koondamise kontrollimine. 44 väljast 6 välja:
7 - Struktuuri eesmärk
16 — maa-aluste korruste arv
17 - Vanemobjekt
21 - Külanõukogu
38 – Struktuuriparameetrid (kirjeldus)
40 – Kultuuripärand
Neil pole ühtegi kirjet. See tähendab, et need on üleliigsed.
Väljal „22 – Linn” on üks kirje, joonis 13.
Joonis 13. Ainus kanne on väljal "Linn" Z_348653.
Väli “34 – Hoone nimi” sisaldab kirjeid, mis selgelt ei vasta välja otstarbele, Joonis 14.
Joonis 14. Näide nõuetele mittevastavast kandest.
Jätame need väljad andmekogumist välja. Ja me registreerime muutuse 214 kirjes.
Laval 4 veedetud aeg kokku (Schumanni valemi jaoks) t4 = 2,5 tund.
Etapil 4 leitud vigade arv (Schumanni valemi jaoks) n4 = 222 tk.
Tabel 6. Andmekogumi näitajate analüüs pärast 4. etappi
Üldiselt võib näitajate muutusi analüüsides (tabel 6) öelda, et:
1) Keskmise sümbolite arvu ja standardhälbe kangi suhe on 3-le lähedane ehk on normaaljaotuse tunnused (kuue sigma reegel).
2) Minimaalse ja maksimaalse hoova oluline kõrvalekalle keskmisest kangist viitab sellele, et sabade uurimine on vigade otsimisel paljulubav suund.
Uurime Schumanni metoodikat kasutades vigade leidmise tulemusi.
Tühikäigu etapid
2.1. Laval 2.1 veedetud aeg kokku (Schumanni valemi jaoks) t21 = 1 tund.
Etapil 2.1 leitud vigade arv (Schumanni valemi jaoks) n21 = 0 tk.
3. Laval 3 veedetud aeg kokku (Schumanni valemi jaoks) t3 = 0,75 tund.
Etapil 3 leitud vigade arv (Schumanni valemi jaoks) n3 = 0 tk.
Tõhusad etapid
2.2. Laval 2.2.1 veedetud aeg kokku (Schumanni valemi jaoks) t221 = 8 tund.
Parandatud vigade arv etapis 2.2.1 (Schumanni valemi jaoks) n221 = 0 tk.
Sammus 2.2.2 kulutatud aeg kokku t222 = 4 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.
Etapis 2.2 kulunud aeg kokku t22 = 8 + 4 = 12 tundi.
Etapil 2.2.2 leitud vigade arv (Schumanni valemi jaoks) n222 = 583 tk.
4. Laval 4 veedetud aeg kokku (Schumanni valemi jaoks) t4 = 2,5 tund.
Etapil 4 leitud vigade arv (Schumanni valemi jaoks) n4 = 222 tk.
Kuna Schumanni mudeli esimesse etappi tuleb lisada nulletappe ja teisest küljest on etapid 2.2 ja 4 oma olemuselt sõltumatud, siis arvestades, et Schumanni mudel eeldab, et suurendades kontrolli kestust, suureneb tõenäosus. vea tuvastamine väheneb, st voog vähendab rikkeid, siis seda voogu uurides teeme kindlaks, milline etapp asetada esimeseks, reegli järgi, kus rikketihedus on sagedasem, asetame selle etapi esimeseks.
Joonis 15.
Joonisel 15 olevast valemist järeldub, et arvutustes on eelistatav asetada neljas etapp enne etappi 2.2.
Schumanni valemi abil määrame hinnangulise esialgse vigade arvu:
Joonis 16.
Joonise 16 tulemustest on näha, et prognoositav vigade arv on N2 = 3167, mis on rohkem kui miinimumkriteerium 1459.
Paranduse tulemusena parandasime 805 viga ja prognoositud arv on 3167 – 805 = 2362, mis on siiski rohkem kui meie aktsepteeritud miinimumlävi.
Määratleme parameetri C, lambda ja töökindlusfunktsiooni:
Joonis 17.
Põhimõtteliselt on lambda igas etapis vigade tuvastamise intensiivsuse tegelik näitaja. Kui ülalt vaadata, siis eelmine hinnang sellele näitajale oli 42,4 viga tunnis, mis on üsna võrreldav Schumanni näitajaga. Selle materjali esimese osa poole pöördudes tehti kindlaks, et 1 kirje kontrollimisel minutis ei tohiks arendaja vigade leidmise määr olla väiksem kui 250,4 viga 1 kirje kohta. Siit tuleneb lambda kriitiline väärtus Schumanni mudeli jaoks:
60 / 250,4 = 0,239617.
See tähendab, et vigade tuvastamise protseduuride läbiviimise vajadus tuleb läbi viia seni, kuni lambda väheneb olemasolevalt 38,964-lt väärtusele 0,239617.
Või kuni indikaator N (potentsiaalne vigade arv) miinus n (parandatud vigade arv) langeb allapoole meie aktsepteeritud läve (esimeses osas) - 1459 tk.
Allikas: www.habr.com