Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

В birinchi qism Ta'kidlanishicha, ushbu nashr Xanti-Mansi avtonom okrugidagi ko'chmas mulk ob'ektlarini kadastr baholash natijalari ma'lumotlari to'plami asosida tayyorlangan.

Amaliy qism bosqichma-bosqich taqdim etiladi. Barcha tozalash Excelda amalga oshirildi, chunki bu eng keng tarqalgan vosita va tasvirlangan operatsiyalar Excel bilan tanish bo'lgan ko'pchilik mutaxassislar tomonidan takrorlanishi mumkin. Bu amaliy ishlar uchun ham juda mos keladi.

Men faylni ishga tushirish va saqlash ishini nol bosqich sifatida qo'yaman, chunki u 100 MB hajmga ega va o'nlab va yuzlab bu operatsiyalar bilan ular katta vaqtni oladi.
Ochilish vaqti o'rtacha 30 soniya.
Vaqtni tejash: 22 sek.

Birinchi bosqich ma'lumotlar to'plamining statistik ko'rsatkichlarini aniqlashdan boshlanadi.

Jadval 1. Ma'lumotlar to'plamining statistik ko'rsatkichlari
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

Texnologiya 2.1.

Yordamchi maydon yaratish; Men uni AY deb nomlayman. Har bir yozuv uchun “=LEN(F365502)+LEN(G365502)+…+LEN(AW365502)” formulasini yarating.

2.1-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t21 = 1 soat.
2.1-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n21 = 0 dona.

Ikkinchi bosqich.
Ma'lumotlar majmuasi komponentlarini tekshirish.
2.2. Yozuvlardagi barcha qiymatlar standart belgilar yordamida shakllantiriladi. Shuning uchun, statistik ma'lumotlarni belgi bo'yicha kuzatamiz.

Jadval 2. Natijalarning dastlabki tahlili bilan ma'lumotlar to'plamidagi belgilarning statistik ko'rsatkichlari.Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

Texnologiya 2.2.1.

Biz yordamchi maydonni yaratamiz - "alpha1". Har bir yozuv uchun “=CONCATENATE(Sheet1!B9;…Sheet1!AQ9)” formulasini yaratamiz.
Biz "Omega-1" deb nomlangan qattiq hujayra yaratamiz. Ushbu katakchaga 32 dan 255 gacha bo'lgan Windows-1251 belgilar kodlarini birma-bir kiritamiz.
Biz yordamchi maydonni yaratamiz - "alpha2". “=TOP (CHAR(Omega;1); “alfa1”;N)” formulasi bilan.
Biz yordamchi maydonni yaratamiz - "alpha3". “=IF(ISNUMBER(“alfa2”;N);1;0)” formulasi bilan
"=SUM("alpha3"N1:"alpha3"N365498)" formulasi bilan "Omega-2" qattiq katakchasini yarating.

Jadval 3. Natijalarni dastlabki tahlil qilish natijalariRok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

Jadval 4. Ushbu bosqichda qayd etilgan xatolarRok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

2.2.1-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t221 = 8 soat.
2.2.1-bosqichda tuzatilgan xatolar soni (Schumann formulasi uchun) n221 = 0 dona.

Stend 3.
Uchinchi qadam - ma'lumotlar to'plamining holatini qayd etish. Har bir yozuvga va har bir maydonga noyob raqam (ID) tayinlaymiz. Bu o'zgartirilgan ma'lumotlar to'plamini asl nusxa bilan solishtirish uchun kerak. Shuningdek, guruhlash va filtrlash imkoniyatlaridan to'liq foydalanish kerak. Bu erda biz yana 2.2.2-jadvalga murojaat qilamiz va ma'lumotlar to'plamida ishlatilmaydigan belgini tanlaymiz. Natija 10-rasmda ko'rsatilgan.

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
10-rasm. Identifikatorlarni tayinlash.

3-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t3 = 0,75 soat.
3-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n3 = 0 dona.

Shuman formulasi bu bosqichni xatolarni tuzatish bilan yakunlanishini talab qilganligi sababli, biz 2-bosqichga qaytamiz.

Stend 2.2.2.
Ushbu bosqichda biz ikki va uch bo'shliqni ham tuzatamiz.
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
11-rasm. Ikkilamchi bo'shliqlar soni.

2.2.4-jadvalda aniqlangan xatolarni tuzatish.

Jadval 5. Xatolarni tuzatish bosqichiRok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

"e" yoki "yo" harflaridan foydalanish kabi jihat nima uchun muhim ekanligiga misol 12-rasmda ko'rsatilgan.

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
12-rasm. “yo” harfidagi nomuvofiqlik.

2.2.2 bosqichda o'tkazilgan umumiy vaqt t222 = 4 soat.
2.2.2-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n222 = 583 dona.

To'rtinchi bosqich.
Maydonning ortiqchaligini tekshirish ushbu bosqichga juda mos keladi. 44 ta maydondan 6 tasi:
7 - Strukturaning maqsadi
16 - er osti qavatlari soni
17 - Ota-ona ob'ekti
21 — Qishloq Kengashi
38 - Struktura parametrlari (tavsif)
40 - Madaniy meros

Ularda bitta kirish yo'q. Ya'ni, ular ortiqcha.
"22 - Shahar" maydonida bitta yozuv mavjud, 13-rasm.

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
13-rasm. “Shahar” maydonidagi yagona yozuv Z_348653.

"34 - Bino nomi" maydonida maydonning maqsadiga aniq mos kelmaydigan yozuvlar mavjud, 14-rasm.

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
14-rasm. Mos kelmaydigan yozuvga misol.

Biz ushbu maydonlarni ma'lumotlar to'plamidan chiqarib tashlaymiz va o'zgarishlarni 214 ta yozuvga yozamiz.

4-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t4 = 2,5 soat.
4-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n4 = 222 dona.

Jadval 6. 4-bosqichdan keyin ma'lumotlar to'plami ko'rsatkichlarini tahlil qilish

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy

Umuman olganda, ko'rsatkichlarning o'zgarishini tahlil qilib (6-jadval), shuni aytishimiz mumkin:
1) Belgilarning o'rtacha sonining standart og'ish dastagiga nisbati 3 ga yaqin, ya'ni normal taqsimot belgilari mavjud (olti sigma qoidasi).
2) Minimal va maksimal tutqichlarning o'rtacha tutqichdan sezilarli og'ishi quyruqlarni o'rganish xatolarni qidirishda istiqbolli yo'nalish ekanligini ko'rsatadi.

Shuman metodologiyasidan foydalangan holda xatolarni topish natijalarini ko'rib chiqamiz.

Bo'sh bosqichlar

2.1. 2.1-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t21 = 1 soat.
2.1-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n21 = 0 dona.

3. 3-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t3 = 0,75 soat.
3-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n3 = 0 dona.

Samarali bosqichlar
2.2. 2.2.1-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t221 = 8 soat.
2.2.1-bosqichda tuzatilgan xatolar soni (Schumann formulasi uchun) n221 = 0 dona.
2.2.2 bosqichda o'tkazilgan umumiy vaqt t222 = 4 soat.
2.2.2-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n222 = 583 dona.

Bosqichda umumiy vaqt 2.2 t22 = 8 + 4 = 12 soat.
2.2.2-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n222 = 583 dona.

4. 4-bosqichda sarflangan umumiy vaqt (Shumann formulasi uchun) t4 = 2,5 soat.
4-bosqichda topilgan xatolar soni (Schumann formulasi uchun) n4 = 222 dona.

Shuman modelining birinchi bosqichiga kiritilishi kerak bo'lgan nol bosqichlar mavjudligi va boshqa tomondan, 2.2 va 4-bosqichlar mohiyatan mustaqil bo'lganligi sababli, Shuman modeli sinov muddatining ko'payishi bilan xatoni aniqlash ehtimoli kamayadi, ya'ni nosozliklar oqimi kamayadi, deb taxmin qilishini hisobga olgan holda, birinchi navbatda, ushbu bosqichni o'rganish orqali biz qaysi bosqichni o'rganishimiz kerakligini aniqlaymiz. qoida, qaerda nosozliklar zichligi tez-tez bo'lsa, bu bosqich birinchi o'ringa qo'yiladi.

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Shakl.15.

15-rasmdagi formuladan kelib chiqadiki, hisob-kitoblarda to'rtinchi bosqichni 2.2-bosqichdan oldin joylashtirish afzalroqdir.

Shuman formulasidan foydalanib, biz xatolarning taxminiy dastlabki sonini aniqlaymiz:

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Shakl.16.

16-rasmdagi natijalardan ko'rinib turibdiki, xatolarning taxmin qilingan soni N2 = 3167, bu minimal mezon 1459 dan kattaroqdir.

Tuzatish natijasida biz 805 ta xatoni tuzatdik va bashorat qilingan raqam 3167 - 805 = 2362 ni tashkil etadi, bu hali ham biz qabul qilgan minimal chegaradan yuqori.

Biz C parametrini, lambda va ishonchlilik funksiyasini aniqlaymiz:

Rok, qog'oz, qaychi o'yini kabi ma'lumotlarni tozalang. Bu oxiri bor yoki tugamaydigan o'yinmi? 2-qism. Amaliy
Shakl.17.

Asosan, lambda har bir bosqichda xatolarni aniqlash tezligining haqiqiy ko'rsatkichidir. Oldingi hisob-kitoblarga qaraganda, bu ko'rsatkich soatiga 42,4 xatoni tashkil etdi, bu Schumann ko'rsatkichi bilan solishtirish mumkin. Ushbu materialning birinchi qismiga murojaat qilgan holda, ishlab chiquvchining xatolarni aniqlash tezligi 250,4 yozuviga 1 ta xatodan kam bo'lmasligi kerakligi aniqlandi, bunda daqiqada bitta yozuv tekshiriladi. Shunday qilib, Shumann modeli uchun kritik lambda qiymati:
60 / 250,4 = 0,239617.

Ya'ni, xatolarni aniqlash tartib-qoidalarini bajarish zarurati lambda mavjud 38,964 dan 0,239617 gacha kamayguncha amalga oshirilishi kerak.

Yoki ko'rsatkich N (potentsial xatolar soni) minus n (tuzatilgan xatolar soni) biz qabul qilgan chegaradan pastga tushmaguncha (birinchi qismda) - 1459 dona.

1-qism. Nazariy.

Manba: www.habr.com

a Izoh qo'shish