Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Π’ bahagian satu telah diterangkan bahawa penerbitan ini dibuat berdasarkan set data keputusan penilaian kadaster hartanah di Okrug Autonomi Khanty-Mansi.

Bahagian amali dibentangkan dalam bentuk langkah. Semua pembersihan telah dilakukan dalam Excel, kerana alat yang paling biasa dan operasi yang diterangkan boleh diulang oleh kebanyakan pakar yang mengetahui Excel. Dan agak sesuai untuk kerja tangan ke tangan.

Peringkat sifar akan menjadi kerja melancarkan dan menyimpan fail, kerana ia bersaiz 100 MB, maka dengan bilangan operasi ini berpuluh-puluh dan ratusan, ia mengambil masa yang ketara.
Pembukaan, secara purata, adalah 30 saat.
Penjimatan – 22 saat.

Peringkat pertama bermula dengan menentukan penunjuk statistik set data.

Jadual 1. Penunjuk statistik bagi set data
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Teknologi 2.1.

Kami mencipta medan tambahan, saya mempunyainya di bawah nombor - AY. Untuk setiap entri, kami membentuk formula β€œ=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)”

Jumlah masa yang dihabiskan di peringkat 2.1 (untuk formula Schumann) t21 = 1 jam.
Bilangan ralat yang ditemui pada peringkat 2.1 (untuk formula Schumann) n21 = 0 pcs.

Peringkat kedua.
Menyemak komponen set data.
2.2. Semua nilai dalam rekod dibentuk menggunakan simbol standard. Oleh itu, mari kita menjejaki statistik mengikut simbol.

Jadual 2. Penunjuk statistik aksara dalam set data dengan analisis awal keputusan.Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Teknologi 2.2.1.

Kami mencipta medan tambahan - "alpha1". Untuk setiap rekod, kami membentuk formula β€œ=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Kami mencipta sel Omega-1 tetap. Kami akan memasukkan kod aksara secara bergilir-gilir mengikut Windows-1251 dari 32 hingga 255 ke dalam sel ini.
Kami mencipta medan tambahan - "alpha2". Dengan formula β€œ=FIND(SIMBOL(Omega,1); β€œalpha1”,N)”.
Kami mencipta medan tambahan - "alpha3". Dengan formula β€œ=IF(ISNUMBER(β€œalpha2”,N),1)”
Buat sel tetap "Omega-2", dengan formula "=SUM("alpha3"N1: "alpha3"N365498)"

Jadual 3. Keputusan analisis awal keputusanBersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Jadual 4. Ralat direkodkan pada peringkat iniBersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Jumlah masa yang dihabiskan di peringkat 2.2.1 (untuk formula Schumann) t221 = 8 jam.
Bilangan ralat yang diperbetulkan pada peringkat 2.2.1 (untuk formula Schumann) n221 = 0 pcs.

Langkah 3.
Langkah ketiga ialah merekodkan keadaan set data. Dengan memberikan setiap rekod nombor unik (ID) dan setiap medan. Ini adalah perlu untuk membandingkan set data yang ditukar dengan set asal. Ini juga perlu untuk memanfaatkan sepenuhnya keupayaan pengelompokan dan penapisan. Di sini sekali lagi kita beralih kepada jadual 2.2.2 dan pilih simbol yang tidak digunakan dalam set data. Kami mendapat apa yang ditunjukkan dalam Rajah 10.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 10. Menetapkan pengecam.

Jumlah masa yang dihabiskan di peringkat 3 (untuk formula Schumann) t3 = 0,75 jam.
Bilangan ralat yang ditemui pada peringkat 3 (untuk formula Schumann) n3 = 0 pcs.

Oleh kerana formula Schumann memerlukan peringkat itu diselesaikan dengan membetulkan ralat. Mari kembali ke tahap 2.

Langkah 2.2.2.
Dalam langkah ini kami juga akan membetulkan ruang dua dan tiga.
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 11. Bilangan ruang berganda.

Pembetulan kesilapan yang dikenal pasti dalam jadual 2.2.4.

Jadual 5. Peringkat pembetulan ralatBersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Contoh mengapa aspek seperti penggunaan huruf "e" atau "e" adalah penting ditunjukkan dalam Rajah 12.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 12. Percanggahan dalam huruf "e".

Jumlah masa yang dibelanjakan dalam langkah 2.2.2 t222 = 4 jam.
Bilangan ralat yang ditemui pada peringkat 2.2.2 (untuk formula Schumann) n222 = 583 pcs.

Peringkat keempat.
Menyemak lebihan medan sesuai dengan peringkat ini. Daripada 44 medan, 6 medan:
7 - Tujuan struktur
16 β€” Bilangan lantai bawah tanah
17 - Objek induk
21 - Majlis Kampung
38 β€” Parameter struktur (penerangan)
40 – Warisan budaya

Mereka tidak mempunyai sebarang penyertaan. Iaitu, mereka berlebihan.
Medan β€œ22 – Bandar” mempunyai satu entri tunggal, Rajah 13.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 13. Satu-satunya entri ialah Z_348653 dalam medan "Bandar".

Medan "34 - Nama bangunan" mengandungi entri yang jelas tidak sepadan dengan tujuan medan, Rajah 14.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 14. Contoh entri tidak patuh.

Kami mengecualikan medan ini daripada set data. Dan kami merekodkan perubahan dalam 214 rekod.

Jumlah masa yang dihabiskan di peringkat 4 (untuk formula Schumann) t4 = 2,5 jam.
Bilangan ralat yang ditemui pada peringkat 4 (untuk formula Schumann) n4 = 222 pcs.

Jadual 6. Analisis penunjuk set data selepas peringkat ke-4

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal

Secara umum, menganalisis perubahan dalam penunjuk (Jadual 6) kita boleh mengatakan bahawa:
1) Nisbah bilangan purata simbol kepada tuas sisihan piawai adalah hampir kepada 3, iaitu, terdapat tanda-tanda taburan normal (peraturan enam sigma).
2) Sisihan ketara tuas minimum dan maksimum daripada tuas purata menunjukkan bahawa kajian ekor adalah arah yang menjanjikan apabila mencari ralat.

Mari kita periksa keputusan mencari ralat menggunakan metodologi Schumann.

Peringkat terbiar

2.1. Jumlah masa yang dihabiskan di peringkat 2.1 (untuk formula Schumann) t21 = 1 jam.
Bilangan ralat yang ditemui pada peringkat 2.1 (untuk formula Schumann) n21 = 0 pcs.

3. Jumlah masa yang dihabiskan di peringkat 3 (untuk formula Schumann) t3 = 0,75 jam.
Bilangan ralat yang ditemui pada peringkat 3 (untuk formula Schumann) n3 = 0 pcs.

Peringkat yang berkesan
2.2. Jumlah masa yang dihabiskan di peringkat 2.2.1 (untuk formula Schumann) t221 = 8 jam.
Bilangan ralat yang diperbetulkan pada peringkat 2.2.1 (untuk formula Schumann) n221 = 0 pcs.
Jumlah masa yang dibelanjakan dalam langkah 2.2.2 t222 = 4 jam.
Bilangan ralat yang ditemui pada peringkat 2.2.2 (untuk formula Schumann) n222 = 583 pcs.

Jumlah masa yang dibelanjakan dalam langkah 2.2 t22 = 8 + 4 = 12 jam.
Bilangan ralat yang ditemui pada peringkat 2.2.2 (untuk formula Schumann) n222 = 583 pcs.

4. Jumlah masa yang dihabiskan di peringkat 4 (untuk formula Schumann) t4 = 2,5 jam.
Bilangan ralat yang ditemui pada peringkat 4 (untuk formula Schumann) n4 = 222 pcs.

Oleh kerana terdapat sifar peringkat yang mesti dimasukkan ke dalam peringkat pertama model Schumann, dan sebaliknya, peringkat 2.2 dan 4 adalah bebas, maka memandangkan model Schumann mengandaikan bahawa dengan meningkatkan tempoh pemeriksaan, kebarangkalian mengesan ralat berkurangan, iaitu aliran mengurangkan kegagalan, maka dengan meneliti aliran ini kita akan menentukan peringkat mana yang perlu didahulukan, mengikut peraturan, di mana ketumpatan kegagalan lebih kerap, kita akan meletakkan peringkat itu terlebih dahulu.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 15.

Daripada formula dalam Rajah 15, adalah lebih baik untuk meletakkan peringkat keempat sebelum peringkat 2.2 dalam pengiraan.

Menggunakan formula Schumann, kami menentukan anggaran bilangan ralat awal:

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 16.

Daripada keputusan dalam Rajah 16 dapat dilihat bahawa bilangan ralat yang diramalkan ialah N2 = 3167, iaitu melebihi kriteria minimum 1459.

Hasil daripada pembetulan, kami membetulkan 805 ralat, dan nombor yang diramalkan ialah 3167 – 805 = 2362, yang masih lebih daripada ambang minimum yang kami terima.

Kami mentakrifkan parameter C, lambda dan fungsi kebolehpercayaan:

Bersihkan data seperti permainan Batu, Kertas, Gunting. Adakah ini permainan dengan atau tanpa penghujung? Bahagian 2. Praktikal
Rajah 17.

Pada asasnya, lambda ialah penunjuk sebenar keamatan yang ralat dikesan pada setiap peringkat. Jika anda melihat di atas, anggaran sebelumnya penunjuk ini ialah 42,4 ralat sejam, yang agak setanding dengan penunjuk Schumann. Berbalik kepada bahagian pertama bahan ini, telah ditentukan bahawa kadar di mana pembangun menemui ralat hendaklah tidak lebih rendah daripada 1 ralat setiap 250,4 rekod, apabila menyemak 1 rekod seminit. Oleh itu nilai kritikal lambda untuk model Schumann:
60/250,4 = 0,239617.

Iaitu, keperluan untuk menjalankan prosedur pengesanan ralat mesti dijalankan sehingga lambda, daripada 38,964 sedia ada, menurun kepada 0,239617.

Atau sehingga penunjuk N (nombor kemungkinan ralat) tolak n (bilangan ralat yang diperbetulkan) berkurangan di bawah ambang yang kami terima (di bahagian pertama) - 1459 pcs.

Bahagian 1. Teori.

Sumber: www.habr.com

Tambah komen