Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

В pirma dalis buvo aprašyta, kad ši publikacija parengta remiantis Hantimansių autonominės apygardos nekilnojamojo turto kadastrinio vertinimo rezultatų duomenų rinkiniu.

Praktinė dalis pateikiama žingsnių forma. Visas valymas buvo atliktas Excel programoje, nes dažniausiai naudojamą įrankį ir aprašytas operacijas gali pakartoti dauguma Excel išmanančių specialistų. Ir gana gerai tinka darbui iš rankų į rankas.

Nulinis etapas bus failo paleidimo ir išsaugojimo darbas, nes jis yra 100 MB dydžio, tada, kai šių operacijų skaičius yra dešimtys ir šimtai, tai užtrunka daug laiko.
Atidarymas vidutiniškai yra 30 sekundžių.
Taupymas – 22 sek.

Pirmasis etapas prasideda nuo duomenų rinkinio statistinių rodiklių nustatymo.

1 lentelė. Duomenų rinkinio statistiniai rodikliai
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

Technologijos 2.1.

Mes sukuriame pagalbinį lauką, aš jį turiu numeriu - AY. Kiekvienam įrašui sudarome formulę „=ILGIS(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)“

Bendras laikas, praleistas 2.1 etape (Šumano formulei) t21 = 1 valanda.
2.1 etape rastų klaidų skaičius (Šumano formulei) n21 = 0 vnt.

Antrasis etapas.
Duomenų rinkinio komponentų tikrinimas.
2.2. Visos įrašų reikšmės formuojamos naudojant standartinius simbolius. Todėl statistiką stebėkime simboliais.

2 lentelė. Duomenų rinkinio simbolių statistiniai rodikliai su išankstine rezultatų analize.Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

Technologijos 2.2.1.

Sukuriame pagalbinį lauką - „alpha1“. Kiekvienam įrašui sudarome formulę „=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)“
Mes sukuriame fiksuotą Omega-1 ląstelę. Į šį langelį pakaitomis įvesime simbolių kodus pagal Windows-1251 nuo 32 iki 255.
Sukuriame pagalbinį lauką - „alpha2“. Su formule „=RASTI(SIMBOLIS(Omega,1); „alfa1“,N)“.
Sukuriame pagalbinį lauką - „alpha3“. Su formule "=JEI(ISSKAIČIUS("alfa2",N),1)
Sukurkite fiksuotą langelį „Omega-2“ su formule „=SUM („alpha3“N1: „alpha3“N365498)“

3 lentelė. Preliminarios rezultatų analizės rezultataiIšvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

4 lentelė. Šiame etape užfiksuotos klaidosIšvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

Bendras laikas, praleistas 2.2.1 etape (Šumano formulei) t221 = 8 valanda.
Ištaisytų klaidų skaičius 2.2.1 etape (Šumano formulei) n221 = 0 vnt.

Žingsnis 3.
Trečias žingsnis yra įrašyti duomenų rinkinio būseną. Kiekvienam įrašui priskiriant unikalų numerį (ID) ir kiekvienam laukui. Tai būtina norint palyginti konvertuotą duomenų rinkinį su pradiniu. Tai taip pat būtina norint išnaudoti visas grupavimo ir filtravimo galimybes. Čia vėl pereiname prie 2.2.2 lentelės ir pasirenkame simbolį, kuris duomenų rinkinyje nenaudojamas. Gauname tai, kas parodyta 10 paveiksle.

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
10 pav. Identifikatorių priskyrimas.

Bendras laikas, praleistas 3 etape (Šumano formulei) t3 = 0,75 valanda.
3 etape rastų klaidų skaičius (Šumano formulei) n3 = 0 vnt.

Kadangi Schumann formulė reikalauja, kad etapas būtų baigtas ištaisant klaidas. Grįžkime į 2 etapą.

Žingsnis 2.2.2.
Šiame žingsnyje taip pat pataisysime dvigubus ir trigubus tarpus.
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
11 pav. Dvigubų tarpų skaičius.

2.2.4 lentelėje nustatytų klaidų taisymas.

5 lentelė. Klaidų taisymo etapasIšvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

Pavyzdys, kodėl toks aspektas kaip „e“ arba „e“ raidžių vartojimas yra reikšmingas, pateiktas 12 paveiksle.

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
12 pav. „e“ raidės neatitikimas.

Bendras laikas, praleistas 2.2.2 veiksme t222 = 4 valandos.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.

Ketvirtasis etapas.
Lauko pertekliaus tikrinimas puikiai tinka šiam etapui. Iš 44 laukų 6 laukai:
7 – Statinio paskirtis
16 — Požeminių aukštų skaičius
17 - Tėvų objektas
21 - Kaimo taryba
38 – Struktūros parametrai (aprašas)
40 – Kultūros paveldas

Jie neturi jokių įrašų. Tai yra, jie yra pertekliniai.
Laukelyje „22 – miestas“ yra vienas įrašas, 13 pav.

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
13 pav. Vienintelis įrašas yra Z_348653 lauke „Miestas“.

Laukelyje „34 – pastato pavadinimas“ yra įrašų, kurie aiškiai neatitinka lauko paskirties, 14 pav.

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
14 pav. Neatitinkančio įrašo pavyzdys.

Šiuos laukus neįtraukiame į duomenų rinkinį. O pokytį fiksuojame 214 įrašų.

Bendras laikas, praleistas 4 etape (Šumano formulei) t4 = 2,5 valanda.
4 etape rastų klaidų skaičius (Šumano formulei) n4 = 222 vnt.

6 lentelė. Duomenų rinkinių rodiklių analizė po IV etapo

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis

Apskritai, analizuojant rodiklių pokyčius (6 lentelė), galime teigti, kad:
1) Vidutinio simbolių skaičiaus ir standartinio nuokrypio svirties santykis yra artimas 3, tai yra, yra normalaus pasiskirstymo požymių (šešių sigmų taisyklė).
2) Reikšmingas minimalaus ir didžiausio svertų nuokrypis nuo vidutinio sverto rodo, kad uodegų tyrimas yra perspektyvi kryptis ieškant klaidų.

Panagrinėkime klaidų radimo rezultatus pagal Schumann metodiką.

Tuščiosios eigos etapai

2.1. Bendras laikas, praleistas 2.1 etape (Šumano formulei) t21 = 1 valanda.
2.1 etape rastų klaidų skaičius (Šumano formulei) n21 = 0 vnt.

3. Bendras laikas, praleistas 3 etape (Šumano formulei) t3 = 0,75 valanda.
3 etape rastų klaidų skaičius (Šumano formulei) n3 = 0 vnt.

Veiksmingi etapai
2.2. Bendras laikas, praleistas 2.2.1 etape (Šumano formulei) t221 = 8 valanda.
Ištaisytų klaidų skaičius 2.2.1 etape (Šumano formulei) n221 = 0 vnt.
Bendras laikas, praleistas 2.2.2 veiksme t222 = 4 valandos.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.

Bendras laikas, praleistas 2.2 žingsnyje.22 t8 = 4 + 12 = XNUMX valandų.
2.2.2 etape rastų klaidų skaičius (Šumano formulei) n222 = 583 vnt.

4. Bendras laikas, praleistas 4 etape (Šumano formulei) t4 = 2,5 valanda.
4 etape rastų klaidų skaičius (Šumano formulei) n4 = 222 vnt.

Kadangi yra nulis etapų, kurie turi būti įtraukti į pirmąjį Schumann modelio etapą, ir, kita vertus, 2.2 ir 4 etapai iš esmės yra nepriklausomi, tai atsižvelgiant į tai, kad Schumann modelis daro prielaidą, kad padidinus patikrinimo trukmę, tikimybė klaidos aptikimo mažėja, tai yra srautas sumažina gedimus, tada nagrinėdami šį srautą nustatysime kurį etapą dėti pirmiau, pagal taisyklę, kur gedimų tankis dažnesnis, tą etapą dėsime pirmiau.

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
15 pav.

Iš 15 paveiksle pateiktos formulės matyti, kad skaičiavimuose ketvirtą etapą geriau dėti prieš 2.2 etapą.

Naudodami Schumano formulę nustatome apskaičiuotą pradinį klaidų skaičių:

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
16 pav.

Iš 16 paveikslo rezultatų matyti, kad prognozuojamas klaidų skaičius yra N2 = 3167, o tai yra daugiau nei minimalus kriterijus 1459.

Taisydami ištaisėme 805 klaidas, o prognozuojamas skaičius yra 3167 – 805 = 2362, o tai vis tiek yra daugiau nei mūsų priimta minimali riba.

Apibrėžiame parametrą C, lambda ir patikimumo funkciją:

Išvalykite duomenis, pavyzdžiui, žaisdami akmenį, popierių, žirkles. Ar tai žaidimas su pabaiga ar be jos? 2 dalis. Praktinis
17 pav.

Iš esmės lambda yra tikrasis kiekvieno etapo klaidų aptikimo intensyvumo rodiklis. Jei pažvelgsite aukščiau, ankstesnis šio rodiklio įvertinimas buvo 42,4 klaidos per valandą, o tai yra gana panašu į Schumann rodiklį. Vartojant pirmąją šios medžiagos dalį, nustatyta, kad kūrėjo klaidų aptikimo dažnis turi būti ne mažesnis kaip 1 klaida 250,4 įrašuose, tikrinant 1 įrašą per minutę. Taigi kritinė lambda vertė Schumann modeliui:
60 / 250,4 = 0,239617.

Tai yra, būtinybė atlikti klaidų aptikimo procedūras turi būti vykdoma tol, kol lambda nuo esamo 38,964 sumažės iki 0,239617.

Arba kol rodiklis N (galimas klaidų skaičius) minus n (pataisytas klaidų skaičius) nesumažės žemiau mūsų priimtos ribos (pirmoje dalyje) - 1459 vnt.

1 dalis. Teorinė.

Šaltinis: www.habr.com

Добавить комментарий