В
Praktinė dalis pateikiama žingsnių forma. Visas valymas buvo atliktas Excel programoje, nes dažniausiai naudojamą įrankį ir aprašytas operacijas gali pakartoti dauguma Excel išmanančių specialistų. Ir gana gerai tinka darbui iš rankų į rankas.
Nulinis etapas bus failo paleidimo ir išsaugojimo darbas, nes jis yra 100 MB dydžio, tada, kai šių operacijų skaičius yra dešimtys ir šimtai, tai užtrunka daug laiko.
Atidarymas vidutiniškai yra 30 sekundžių.
Taupymas – 22 sek.
Pirmasis etapas prasideda nuo duomenų rinkinio statistinių rodiklių nustatymo.
1 lentelė. Duomenų rinkinio statistiniai rodikliai
Technologijos 2.1.
Mes sukuriame pagalbinį lauką, aš jį turiu numeriu - AY. Kiekvienam įrašui sudarome formulę „=ILGIS(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)“
Bendras laikas, praleistas 2.1 etape (Šumano formulei) t21 = 1 valanda.
2.1 etape rastų klaidų skaičius (Šumano formulei) n21 = 0 vnt.
Antrasis etapas.
Duomenų rinkinio komponentų tikrinimas.
2.2. Visos įrašų reikšmės formuojamos naudojant standartinius simbolius. Todėl statistiką stebėkime simboliais.
2 lentelė. Duomenų rinkinio simbolių statistiniai rodikliai su išankstine rezultatų analize.
Technologijos 2.2.1.
Sukuriame pagalbinį lauką - „alpha1“. Kiekvienam įrašui sudarome formulę „=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)“
Mes sukuriame fiksuotą Omega-1 ląstelę. Į šį langelį pakaitomis įvesime simbolių kodus pagal Windows-1251 nuo 32 iki 255.
Sukuriame pagalbinį lauką - „alpha2“. Su formule „=RASTI(SIMBOLIS(Omega,1); „alfa1“,N)“.
Sukuriame pagalbinį lauką - „alpha3“. Su formule "=JEI(ISSKAIČIUS("alfa2",N),1)
Sukurkite fiksuotą langelį „Omega-2“ su formule „=SUM („alpha3“N1: „alpha3“N365498)“
3 lentelė. Preliminarios rezultatų analizės rezultatai
4 lentelė. Šiame etape užfiksuotos klaidos
Bendras laikas, praleistas 2.2.1 etape (Šumano formulei) t221 = 8 valanda.
Ištaisytų klaidų skaičius 2.2.1 etape (Šumano formulei) n221 = 0 vnt.
Žingsnis 3.
Trečias žingsnis yra įrašyti duomenų rinkinio būseną. Kiekvienam įrašui priskiriant unikalų numerį (ID) ir kiekvienam laukui. Tai būtina norint palyginti konvertuotą duomenų rinkinį su pradiniu. Tai taip pat būtina norint išnaudoti visas grupavimo ir filtravimo galimybes. Čia vėl pereiname prie 2.2.2 lentelės ir pasirenkame simbolį, kuris duomenų rinkinyje nenaudojamas. Gauname tai, kas parodyta 10 paveiksle.
10 pav. Identifikatorių priskyrimas.
Bendras laikas, praleistas 3 etape (Šumano formulei) t3 = 0,75 valanda.
3 etape rastų klaidų skaičius (Šumano formulei) n3 = 0 vnt.
Kadangi Schumann formulė reikalauja, kad etapas būtų baigtas ištaisant klaidas. Grįžkime į 2 etapą.
Žingsnis 2.2.2.
Šiame žingsnyje taip pat pataisysime dvigubus ir trigubus tarpus.
11 pav. Dvigubų tarpų skaičius.
2.2.4 lentelėje nustatytų klaidų taisymas.
5 lentelė. Klaidų taisymo etapas
Pavyzdys, kodėl toks aspektas kaip „e“ arba „e“ raidžių vartojimas yra reikšmingas, pateiktas 12 paveiksle.
12 pav. „e“ raidės neatitikimas.
Bendras laikas, praleistas 2.2.2 veiksme t222 = 4 valandos.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.
Ketvirtasis etapas.
Lauko pertekliaus tikrinimas puikiai tinka šiam etapui. Iš 44 laukų 6 laukai:
7 – Statinio paskirtis
16 — Požeminių aukštų skaičius
17 - Tėvų objektas
21 - Kaimo taryba
38 – Struktūros parametrai (aprašas)
40 – Kultūros paveldas
Jie neturi jokių įrašų. Tai yra, jie yra pertekliniai.
Laukelyje „22 – miestas“ yra vienas įrašas, 13 pav.
13 pav. Vienintelis įrašas yra Z_348653 lauke „Miestas“.
Laukelyje „34 – pastato pavadinimas“ yra įrašų, kurie aiškiai neatitinka lauko paskirties, 14 pav.
14 pav. Neatitinkančio įrašo pavyzdys.
Šiuos laukus neįtraukiame į duomenų rinkinį. O pokytį fiksuojame 214 įrašų.
Bendras laikas, praleistas 4 etape (Šumano formulei) t4 = 2,5 valanda.
4 etape rastų klaidų skaičius (Šumano formulei) n4 = 222 vnt.
6 lentelė. Duomenų rinkinių rodiklių analizė po IV etapo
Apskritai, analizuojant rodiklių pokyčius (6 lentelė), galime teigti, kad:
1) Vidutinio simbolių skaičiaus ir standartinio nuokrypio svirties santykis yra artimas 3, tai yra, yra normalaus pasiskirstymo požymių (šešių sigmų taisyklė).
2) Reikšmingas minimalaus ir didžiausio svertų nuokrypis nuo vidutinio sverto rodo, kad uodegų tyrimas yra perspektyvi kryptis ieškant klaidų.
Panagrinėkime klaidų radimo rezultatus pagal Schumann metodiką.
Tuščiosios eigos etapai
2.1. Bendras laikas, praleistas 2.1 etape (Šumano formulei) t21 = 1 valanda.
2.1 etape rastų klaidų skaičius (Šumano formulei) n21 = 0 vnt.
3. Bendras laikas, praleistas 3 etape (Šumano formulei) t3 = 0,75 valanda.
3 etape rastų klaidų skaičius (Šumano formulei) n3 = 0 vnt.
Veiksmingi etapai
2.2. Bendras laikas, praleistas 2.2.1 etape (Šumano formulei) t221 = 8 valanda.
Ištaisytų klaidų skaičius 2.2.1 etape (Šumano formulei) n221 = 0 vnt.
Bendras laikas, praleistas 2.2.2 veiksme t222 = 4 valandos.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.
Bendras laikas, praleistas 2.2 žingsnyje.22 t8 = 4 + 12 = XNUMX valandų.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.
4. Bendras laikas, praleistas 4 etape (Šumano formulei) t4 = 2,5 valanda.
4 etape rastų klaidų skaičius (Šumano formulei) n4 = 222 vnt.
Kadangi yra nulis etapų, kurie turi būti įtraukti į pirmąjį Schumann modelio etapą, ir, kita vertus, 2.2 ir 4 etapai iš esmės yra nepriklausomi, tai atsižvelgiant į tai, kad Schumann modelis daro prielaidą, kad padidinus patikrinimo trukmę, tikimybė klaidos aptikimo mažėja, tai yra srautas sumažina gedimus, tada nagrinėdami šį srautą nustatysime kurį etapą dėti pirmiau, pagal taisyklę, kur gedimų tankis dažnesnis, tą etapą dėsime pirmiau.
15 pav.
Iš 15 paveiksle pateiktos formulės matyti, kad skaičiavimuose ketvirtą etapą geriau dėti prieš 2.2 etapą.
Naudodami Schumano formulę nustatome apskaičiuotą pradinį klaidų skaičių:
16 pav.
Iš 16 paveikslo rezultatų matyti, kad prognozuojamas klaidų skaičius yra N2 = 3167, o tai yra daugiau nei minimalus kriterijus 1459.
Taisydami ištaisėme 805 klaidas, o prognozuojamas skaičius yra 3167 – 805 = 2362, o tai vis tiek yra daugiau nei mūsų priimta minimali riba.
Apibrėžiame parametrą C, lambda ir patikimumo funkciją:
17 pav.
Iš esmės lambda yra tikrasis kiekvieno etapo klaidų aptikimo intensyvumo rodiklis. Jei pažvelgsite aukščiau, ankstesnis šio rodiklio įvertinimas buvo 42,4 klaidos per valandą, o tai yra gana panašu į Schumann rodiklį. Vartojant pirmąją šios medžiagos dalį, nustatyta, kad kūrėjo klaidų aptikimo dažnis turi būti ne mažesnis kaip 1 klaida 250,4 įrašuose, tikrinant 1 įrašą per minutę. Taigi kritinė lambda vertė Schumann modeliui:
60 / 250,4 = 0,239617.
Tai yra, būtinybė atlikti klaidų aptikimo procedūras turi būti vykdoma tol, kol lambda nuo esamo 38,964 sumažės iki 0,239617.
Arba kol rodiklis N (galimas klaidų skaičius) minus n (pataisytas klaidų skaičius) nesumažės žemiau mūsų priimtos ribos (pirmoje dalyje) - 1459 vnt.
Šaltinis: www.habr.com