Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

В első rész leírták, hogy ez a kiadvány a Hanti-Manszi Autonóm Kerület ingatlanjainak kataszteri értékelési eredményeinek adatsora alapján készült.

A gyakorlati részt lépések formájában mutatjuk be. Minden tisztítás Excelben történt, hiszen a legáltalánosabb eszközt és a leírt műveleteket a legtöbb Excelt ismerő szakember meg tudja ismételni. És elég jól alkalmas a kézi munkára.

A nulladik szakasz a fájl indítása és mentése lesz, mivel 100 MB méretű, majd ezeknek a műveleteknek a száma tíz és száz, jelentős időt vesz igénybe.
A nyitás átlagosan 30 másodperc.
Mentés – 22 mp.

Az első szakasz az adathalmaz statisztikai mutatóinak meghatározásával kezdődik.

1. táblázat Az adathalmaz statisztikai mutatói
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

Technológia 2.1.

Létrehozunk egy segédmezőt, nálam az AY szám alatt van. Minden bejegyzéshez a „=HOSSZ(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)” képletet hozzuk létre.

A 2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t21 = 1 óra.
A 2.1. szakaszban talált hibák száma (Schumann-képlet esetén) n21 = 0 db.

A második szakasz.
Az adatkészlet összetevőinek ellenőrzése.
2.2. A rekordokban lévő összes érték szabványos szimbólumokkal van kialakítva. Kövessük tehát a statisztikákat szimbólumokkal.

2. táblázat: Az adatkészlet karaktereinek statisztikai mutatói az eredmények előzetes elemzésével.Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

Technológia 2.2.1.

Létrehozunk egy segédmezőt - „alpha1”. Minden rekordhoz a következő képletet hozzuk létre: „=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Létrehozunk egy fix Omega-1 sejtet. Ebbe a cellába felváltva írunk be karakterkódokat a Windows-1251 szerint 32 és 255 között.
Létrehozunk egy segédmezőt - „alpha2”. A „=KERESÉS(SYMBOL(Omega,1); „alfa1”,N) képlettel.
Létrehozunk egy segédmezőt - „alpha3”. A következő képlettel: „=HA(ISSZÁM(“alfa2”,N),1)”
Hozzon létre egy "Omega-2" rögzített cellát a következő képlettel: "=SUM("alpha3"N1: "alpha3"N365498)"

3. táblázat: Az eredmények előzetes elemzésének eredményeiTisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

4. táblázat: Ebben a szakaszban rögzített hibákTisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

A 2.2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t221 = 8 óra.
Javított hibák száma a 2.2.1 szakaszban (Schumann-képlethez) n221 = 0 db.

Lépés 3.
A harmadik lépés az adatkészlet állapotának rögzítése. Minden rekordhoz egyedi szám (ID) és minden mező hozzárendelésével. Erre azért van szükség, hogy a konvertált adatkészletet összehasonlítsuk az eredetivel. Ez a csoportosítási és szűrési lehetőségek teljes kihasználásához is szükséges. Itt ismét áttérünk a 2.2.2 táblázatra, és kiválasztunk egy olyan szimbólumot, amelyet nem használunk az adatkészletben. Azt kapjuk, amit a 10. ábra mutat.

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
10. ábra. Azonosítók hozzárendelése.

A 3 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t3 = 0,75 óra.
A 3. szakaszban talált hibák száma (Schumann-képlet esetén) n3 = 0 db.

Mivel a Schumann-képlet megköveteli, hogy a szakaszt hibák kijavításával fejezzék be. Térjünk vissza a 2. szakaszhoz.

Lépés 2.2.2.
Ebben a lépésben a dupla és tripla szóközöket is javítjuk.
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
11. ábra. Dupla szóközök száma.

A 2.2.4. táblázatban azonosított hibák javítása.

5. táblázat: Hibajavítási szakaszTisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

A 12. ábrán látható egy példa arra, hogy miért jelentős egy olyan szempont, mint az „e” vagy „e” betűk használata.

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
12. ábra. Eltérés az "e" betűben.

A 2.2.2 lépésben eltöltött teljes idő t222 = 4 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.

Negyedik szakasz.
A terepi redundancia ellenőrzése jól illeszkedik ebbe a szakaszba. A 44 mezőből 6 mező:
7 - A szerkezet célja
16 — Földalatti szintek száma
17 - Szülőobjektum
21 - Községi Tanács
38 – Szerkezeti paraméterek (leírás)
40 – Kulturális örökség

Nincsenek bejegyzéseik. Vagyis feleslegesek.
A „22 – Város” mező egyetlen bejegyzést tartalmaz, 13. ábra.

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
13. ábra. Az egyetlen bejegyzés a Z_348653 a „Város” mezőben.

A „34 – Épületnév” mező olyan bejegyzéseket tartalmaz, amelyek egyértelműen nem felelnek meg a mező céljának, 14. ábra.

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
14. ábra. Példa egy nem megfelelő bejegyzésre.

Ezeket a mezőket kizárjuk az adatkészletből. A változást pedig 214 rekordban rögzítjük.

A 4 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t4 = 2,5 óra.
A 4. szakaszban talált hibák száma (Schumann-képlet esetén) n4 = 222 db.

6. táblázat Az adatsor-mutatók elemzése a 4. szakasz után

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati

A mutatók változásait elemezve (6. táblázat) általánosságban elmondható, hogy:
1) Az átlagos szimbólumszám és a szóráskar aránya megközelíti a 3-at, vagyis normális eloszlás jelei vannak (hat szigma szabály).
2) A minimális és maximális karok jelentős eltérése az átlagos kartól azt sugallja, hogy a farok vizsgálata ígéretes irány a hibák keresésében.

Vizsgáljuk meg a hibakeresés eredményeit Schumann módszertanával.

Üresjárati szakaszok

2.1. A 2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t21 = 1 óra.
A 2.1. szakaszban talált hibák száma (Schumann-képlet esetén) n21 = 0 db.

3. A 3 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t3 = 0,75 óra.
A 3. szakaszban talált hibák száma (Schumann-képlet esetén) n3 = 0 db.

Hatékony szakaszok
2.2. A 2.2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t221 = 8 óra.
Javított hibák száma a 2.2.1 szakaszban (Schumann-képlethez) n221 = 0 db.
A 2.2.2 lépésben eltöltött teljes idő t222 = 4 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.

A 2.2. lépésben eltöltött teljes idő t22 = 8 + 4 = 12 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.

4. A 4 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t4 = 2,5 óra.
A 4. szakaszban talált hibák száma (Schumann-képlet esetén) n4 = 222 db.

Mivel a Schumann-modell első szakaszába nulla szakaszt kell belefoglalni, másrészt a 2.2 és 4 szakaszok eredendően függetlenek, ezért a Schumann-modell feltételezi, hogy az ellenőrzés időtartamának növelésével a valószínűség A hiba észlelése csökken, azaz az áramlás csökkenti a meghibásodásokat, akkor ennek az áramlásnak a vizsgálatával határozzuk meg, hogy melyik szakaszt helyezzük elõbbre, a szabály szerint, ahol gyakoribb a hibasûrûség, azt a fokozatot helyezzük elõbbre.

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
15. ábra

A 15. ábra képletéből az következik, hogy célszerű a negyedik szakaszt a 2.2. szakasz elé helyezni a számításokban.

A Schumann-képlet segítségével meghatározzuk a hibák becsült kezdeti számát:

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
16. ábra

A 16. ábra eredményeiből látható, hogy az előre jelzett hibák száma N2 = 3167, ami több, mint a minimális 1459-es kritérium.

A javítás eredményeként 805 hibát javítottunk ki, az előre jelzett szám 3167 – 805 = 2362, ami még mindig meghaladja az általunk elfogadott minimális küszöböt.

Meghatározzuk a C paramétert, a lambdát és a megbízhatósági függvényt:

Tisztítsa meg az adatokat, például egy Rock, Paper, Scissors játékkal. Ez egy játék befejezéssel vagy anélkül? 2. rész Gyakorlati
17. ábra

Lényegében a lambda annak az intenzitásnak a tényleges mutatója, amellyel a hibákat az egyes szakaszokban észlelik. Ha feljebb nézzük, ennek a mutatónak a korábbi becslése 42,4 hiba volt óránként, ami eléggé összevethető a Schumann-mutatóval. Az anyag első részéhez fordulva megállapították, hogy a fejlesztő által talált hibák aránya nem lehet kisebb, mint 1 hiba 250,4 rekordonként, percenként 1 rekord ellenőrzésekor. Innen származik a lambda kritikus értéke a Schumann-modellhez:
60 / 250,4 = 0,239617.

Vagyis a hibafeltárási eljárások elvégzésének szükségességét addig kell végrehajtani, amíg a lambda a meglévő 38,964-ről 0,239617-re nem csökken.

Vagy amíg az N (potenciális hibák száma) mínusz n (javított hibák száma) mutató az általunk elfogadott küszöb alá nem csökken (az első részben) - 1459 db.

1. rész Elméleti.

Forrás: will.com

Hozzászólás