В
A gyakorlati részt lépések formájában mutatjuk be. Minden tisztítás Excelben történt, hiszen a legáltalánosabb eszközt és a leírt műveleteket a legtöbb Excelt ismerő szakember meg tudja ismételni. És elég jól alkalmas a kézi munkára.
A nulladik szakasz a fájl indítása és mentése lesz, mivel 100 MB méretű, majd ezeknek a műveleteknek a száma tíz és száz, jelentős időt vesz igénybe.
A nyitás átlagosan 30 másodperc.
Mentés – 22 mp.
Az első szakasz az adathalmaz statisztikai mutatóinak meghatározásával kezdődik.
1. táblázat Az adathalmaz statisztikai mutatói
Technológia 2.1.
Létrehozunk egy segédmezőt, nálam az AY szám alatt van. Minden bejegyzéshez a „=HOSSZ(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)” képletet hozzuk létre.
A 2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t21 = 1 óra.
A 2.1. szakaszban talált hibák száma (Schumann-képlet esetén) n21 = 0 db.
A második szakasz.
Az adatkészlet összetevőinek ellenőrzése.
2.2. A rekordokban lévő összes érték szabványos szimbólumokkal van kialakítva. Kövessük tehát a statisztikákat szimbólumokkal.
2. táblázat: Az adatkészlet karaktereinek statisztikai mutatói az eredmények előzetes elemzésével.
Technológia 2.2.1.
Létrehozunk egy segédmezőt - „alpha1”. Minden rekordhoz a következő képletet hozzuk létre: „=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Létrehozunk egy fix Omega-1 sejtet. Ebbe a cellába felváltva írunk be karakterkódokat a Windows-1251 szerint 32 és 255 között.
Létrehozunk egy segédmezőt - „alpha2”. A „=KERESÉS(SYMBOL(Omega,1); „alfa1”,N) képlettel.
Létrehozunk egy segédmezőt - „alpha3”. A következő képlettel: „=HA(ISSZÁM(“alfa2”,N),1)”
Hozzon létre egy "Omega-2" rögzített cellát a következő képlettel: "=SUM("alpha3"N1: "alpha3"N365498)"
3. táblázat: Az eredmények előzetes elemzésének eredményei
4. táblázat: Ebben a szakaszban rögzített hibák
A 2.2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t221 = 8 óra.
Javított hibák száma a 2.2.1 szakaszban (Schumann-képlethez) n221 = 0 db.
Lépés 3.
A harmadik lépés az adatkészlet állapotának rögzítése. Minden rekordhoz egyedi szám (ID) és minden mező hozzárendelésével. Erre azért van szükség, hogy a konvertált adatkészletet összehasonlítsuk az eredetivel. Ez a csoportosítási és szűrési lehetőségek teljes kihasználásához is szükséges. Itt ismét áttérünk a 2.2.2 táblázatra, és kiválasztunk egy olyan szimbólumot, amelyet nem használunk az adatkészletben. Azt kapjuk, amit a 10. ábra mutat.
10. ábra. Azonosítók hozzárendelése.
A 3 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t3 = 0,75 óra.
A 3. szakaszban talált hibák száma (Schumann-képlet esetén) n3 = 0 db.
Mivel a Schumann-képlet megköveteli, hogy a szakaszt hibák kijavításával fejezzék be. Térjünk vissza a 2. szakaszhoz.
Lépés 2.2.2.
Ebben a lépésben a dupla és tripla szóközöket is javítjuk.
11. ábra. Dupla szóközök száma.
A 2.2.4. táblázatban azonosított hibák javítása.
5. táblázat: Hibajavítási szakasz
A 12. ábrán látható egy példa arra, hogy miért jelentős egy olyan szempont, mint az „e” vagy „e” betűk használata.
12. ábra. Eltérés az "e" betűben.
A 2.2.2 lépésben eltöltött teljes idő t222 = 4 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.
Negyedik szakasz.
A terepi redundancia ellenőrzése jól illeszkedik ebbe a szakaszba. A 44 mezőből 6 mező:
7 - A szerkezet célja
16 — Földalatti szintek száma
17 - Szülőobjektum
21 - Községi Tanács
38 – Szerkezeti paraméterek (leírás)
40 – Kulturális örökség
Nincsenek bejegyzéseik. Vagyis feleslegesek.
A „22 – Város” mező egyetlen bejegyzést tartalmaz, 13. ábra.
13. ábra. Az egyetlen bejegyzés a Z_348653 a „Város” mezőben.
A „34 – Épületnév” mező olyan bejegyzéseket tartalmaz, amelyek egyértelműen nem felelnek meg a mező céljának, 14. ábra.
14. ábra. Példa egy nem megfelelő bejegyzésre.
Ezeket a mezőket kizárjuk az adatkészletből. A változást pedig 214 rekordban rögzítjük.
A 4 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t4 = 2,5 óra.
A 4. szakaszban talált hibák száma (Schumann-képlet esetén) n4 = 222 db.
6. táblázat Az adatsor-mutatók elemzése a 4. szakasz után
A mutatók változásait elemezve (6. táblázat) általánosságban elmondható, hogy:
1) Az átlagos szimbólumszám és a szóráskar aránya megközelíti a 3-at, vagyis normális eloszlás jelei vannak (hat szigma szabály).
2) A minimális és maximális karok jelentős eltérése az átlagos kartól azt sugallja, hogy a farok vizsgálata ígéretes irány a hibák keresésében.
Vizsgáljuk meg a hibakeresés eredményeit Schumann módszertanával.
Üresjárati szakaszok
2.1. A 2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t21 = 1 óra.
A 2.1. szakaszban talált hibák száma (Schumann-képlet esetén) n21 = 0 db.
3. A 3 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t3 = 0,75 óra.
A 3. szakaszban talált hibák száma (Schumann-képlet esetén) n3 = 0 db.
Hatékony szakaszok
2.2. A 2.2.1 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t221 = 8 óra.
Javított hibák száma a 2.2.1 szakaszban (Schumann-képlethez) n221 = 0 db.
A 2.2.2 lépésben eltöltött teljes idő t222 = 4 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.
A 2.2. lépésben eltöltött teljes idő t22 = 8 + 4 = 12 óra.
A 2.2.2. szakaszban talált hibák száma (Schumann-képlet esetén) n222 = 583 db.
4. A 4 szakaszon eltöltött teljes idő (Schumann-képlet esetén) t4 = 2,5 óra.
A 4. szakaszban talált hibák száma (Schumann-képlet esetén) n4 = 222 db.
Mivel a Schumann-modell első szakaszába nulla szakaszt kell belefoglalni, másrészt a 2.2 és 4 szakaszok eredendően függetlenek, ezért a Schumann-modell feltételezi, hogy az ellenőrzés időtartamának növelésével a valószínűség A hiba észlelése csökken, azaz az áramlás csökkenti a meghibásodásokat, akkor ennek az áramlásnak a vizsgálatával határozzuk meg, hogy melyik szakaszt helyezzük elõbbre, a szabály szerint, ahol gyakoribb a hibasûrûség, azt a fokozatot helyezzük elõbbre.
15. ábra
A 15. ábra képletéből az következik, hogy célszerű a negyedik szakaszt a 2.2. szakasz elé helyezni a számításokban.
A Schumann-képlet segítségével meghatározzuk a hibák becsült kezdeti számát:
16. ábra
A 16. ábra eredményeiből látható, hogy az előre jelzett hibák száma N2 = 3167, ami több, mint a minimális 1459-es kritérium.
A javítás eredményeként 805 hibát javítottunk ki, az előre jelzett szám 3167 – 805 = 2362, ami még mindig meghaladja az általunk elfogadott minimális küszöböt.
Meghatározzuk a C paramétert, a lambdát és a megbízhatósági függvényt:
17. ábra
Lényegében a lambda annak az intenzitásnak a tényleges mutatója, amellyel a hibákat az egyes szakaszokban észlelik. Ha feljebb nézzük, ennek a mutatónak a korábbi becslése 42,4 hiba volt óránként, ami eléggé összevethető a Schumann-mutatóval. Az anyag első részéhez fordulva megállapították, hogy a fejlesztő által talált hibák aránya nem lehet kisebb, mint 1 hiba 250,4 rekordonként, percenként 1 rekord ellenőrzésekor. Innen származik a lambda kritikus értéke a Schumann-modellhez:
60 / 250,4 = 0,239617.
Vagyis a hibafeltárási eljárások elvégzésének szükségességét addig kell végrehajtani, amíg a lambda a meglévő 38,964-ről 0,239617-re nem csökken.
Vagy amíg az N (potenciális hibák száma) mínusz n (javított hibák száma) mutató az általunk elfogadott küszöb alá nem csökken (az első részben) - 1459 db.
Forrás: will.com