Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

В bagian satu dijelaskan bahwa publikasi ini dibuat berdasarkan kumpulan data hasil penilaian kadaster real estat di Okrug Otonomi Khanty-Mansi.

Bagian praktisnya disajikan dalam bentuk langkah-langkah. Semua pembersihan dilakukan di Excel, karena alat paling umum dan operasi yang dijelaskan dapat diulangi oleh sebagian besar spesialis yang mengetahui Excel. Dan cukup cocok untuk pekerjaan tangan kosong.

Tahap nol adalah pekerjaan meluncurkan dan menyimpan file, karena ukurannya 100 MB, kemudian dengan jumlah operasi ini puluhan dan ratusan, membutuhkan waktu yang cukup lama.
Pembukaan rata-rata adalah 30 detik.
Menyimpan – 22 detik.

Tahap pertama dimulai dengan menentukan indikator statistik dari dataset.

Tabel 1. Indikator statistik kumpulan data
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Teknologi 2.1.

Kami membuat bidang tambahan, saya memilikinya di bawah nomor - AY. Untuk setiap entri, kita membentuk rumus “=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)”

Total waktu yang dihabiskan pada tahap 2.1 (untuk rumus Schumann) t21 = 1 jam.
Banyaknya kesalahan yang ditemukan pada tahap 2.1 (untuk rumus Schumann) n21 = 0 pcs.

Tahap kedua.
Memeriksa komponen kumpulan data.
2.2. Semua nilai dalam catatan dibentuk menggunakan simbol standar. Oleh karena itu, mari kita lacak statistik berdasarkan simbol.

Tabel 2. Indikator statistik karakter dalam dataset dengan analisis awal hasil.Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Teknologi 2.2.1.

Kami membuat bidang tambahan - "alpha1". Untuk setiap record, kita membentuk rumus “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)”
Kami membuat sel Omega-1 yang tetap. Kami akan memasukkan kode karakter secara bergantian menurut Windows-1251 dari 32 hingga 255 ke dalam sel ini.
Kami membuat bidang tambahan - "alpha2". Dengan rumus “=FIND(SYMBOL(Omega,1); “alpha1”,N)”.
Kami membuat bidang tambahan - "alpha3". Dengan rumus “=IF(ISNUMBER(“alpha2”,N),1)”
Buat sel tetap “Omega-2”, dengan rumus “=SUM(“alpha3”N1: “alpha3”N365498)”

Tabel 3. Hasil analisis awal hasilBersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Tabel 4. Kesalahan yang dicatat pada tahap iniBersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Total waktu yang dihabiskan pada tahap 2.2.1 (untuk rumus Schumann) t221 = 8 jam.
Banyaknya kesalahan yang diperbaiki pada tahap 2.2.1 (untuk rumus Schumann) n221 = 0 pcs.

Langkah 3.
Langkah ketiga adalah mencatat status dataset. Dengan menetapkan setiap rekaman nomor unik (ID) dan setiap bidang. Hal ini diperlukan untuk membandingkan kumpulan data yang dikonversi dengan kumpulan data asli. Hal ini juga diperlukan untuk memanfaatkan sepenuhnya kemampuan pengelompokan dan pemfilteran. Di sini sekali lagi kita beralih ke tabel 2.2.2 dan memilih simbol yang tidak digunakan dalam dataset. Kami mendapatkan apa yang ditunjukkan pada Gambar 10.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Gambar 10. Menugaskan pengidentifikasi.

Total waktu yang dihabiskan pada tahap 3 (untuk rumus Schumann) t3 = 0,75 jam.
Banyaknya kesalahan yang ditemukan pada tahap 3 (untuk rumus Schumann) n3 = 0 pcs.

Karena rumus Schumann mengharuskan tahapan tersebut diselesaikan dengan mengoreksi kesalahan. Mari kita kembali ke tahap 2.

Langkah 2.2.2.
Pada langkah ini kita juga akan mengoreksi spasi ganda dan tripel.
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Gambar 11. Jumlah spasi ganda.

Koreksi kesalahan teridentifikasi pada tabel 2.2.4.

Tabel 5. Tahapan koreksi kesalahanBersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Contoh mengapa aspek penggunaan huruf “e” atau “e” itu penting disajikan pada Gambar 12.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Gambar 12. Kesesuaian pada huruf “e”.

Total waktu yang dihabiskan pada langkah 2.2.2 t222 = 4 jam.
Banyaknya kesalahan yang ditemukan pada tahap 2.2.2 (untuk rumus Schumann) n222 = 583 pcs.

Tahap keempat.
Memeriksa redundansi lapangan cocok dengan tahap ini. Dari 44 bidang, 6 bidang:
7 - Tujuan struktur
16 — Jumlah lantai bawah tanah
17 - Objek induk
21 - Dewan Desa
38 — Parameter struktur (deskripsi)
40 – Warisan budaya

Mereka tidak memiliki entri apa pun. Artinya, mereka mubazir.
Bidang “22 – Kota” mempunyai satu entri, Gambar 13.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Gambar 13. Satu-satunya entri adalah Z_348653 di bidang “Kota”.

Bidang “34 - Nama bangunan” berisi isian yang jelas-jelas tidak sesuai dengan tujuan bidang tersebut, Gambar 14.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Gambar 14. Contoh entri yang tidak patuh.

Kami mengecualikan bidang ini dari kumpulan data. Dan kami mencatat perubahannya dalam 214 catatan.

Total waktu yang dihabiskan pada tahap 4 (untuk rumus Schumann) t4 = 2,5 jam.
Banyaknya kesalahan yang ditemukan pada tahap 4 (untuk rumus Schumann) n4 = 222 pcs.

Tabel 6. Analisis indikator kumpulan data setelah tahap ke-4

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis

Secara umum, menganalisis perubahan indikator (Tabel 6) kita dapat mengatakan bahwa:
1) Perbandingan rata-rata jumlah simbol terhadap tuas simpangan baku mendekati 3, yaitu terdapat tanda-tanda berdistribusi normal (aturan six sigma).
2) Penyimpangan yang signifikan antara tuas minimum dan maksimum dari tuas rata-rata menunjukkan bahwa studi tentang ekor adalah arah yang menjanjikan dalam mencari kesalahan.

Mari kita periksa hasil pencarian kesalahan menggunakan metodologi Schumann.

Tahapan menganggur

2.1. Total waktu yang dihabiskan pada tahap 2.1 (untuk rumus Schumann) t21 = 1 jam.
Banyaknya kesalahan yang ditemukan pada tahap 2.1 (untuk rumus Schumann) n21 = 0 pcs.

3. Total waktu yang dihabiskan pada tahap 3 (untuk rumus Schumann) t3 = 0,75 jam.
Banyaknya kesalahan yang ditemukan pada tahap 3 (untuk rumus Schumann) n3 = 0 pcs.

Tahapan yang efektif
2.2. Total waktu yang dihabiskan pada tahap 2.2.1 (untuk rumus Schumann) t221 = 8 jam.
Banyaknya kesalahan yang diperbaiki pada tahap 2.2.1 (untuk rumus Schumann) n221 = 0 pcs.
Total waktu yang dihabiskan pada langkah 2.2.2 t222 = 4 jam.
Banyaknya kesalahan yang ditemukan pada tahap 2.2.2 (untuk rumus Schumann) n222 = 583 pcs.

Total waktu yang dihabiskan pada langkah 2.2 t22 = 8 + 4 = 12 jam.
Banyaknya kesalahan yang ditemukan pada tahap 2.2.2 (untuk rumus Schumann) n222 = 583 pcs.

4. Total waktu yang dihabiskan pada tahap 4 (untuk rumus Schumann) t4 = 2,5 jam.
Banyaknya kesalahan yang ditemukan pada tahap 4 (untuk rumus Schumann) n4 = 222 pcs.

Karena tidak ada tahapan yang harus dimasukkan dalam tahap pertama model Schumann, dan sebaliknya, tahap 2.2 dan 4 pada dasarnya independen, maka model Schumann mengasumsikan bahwa dengan meningkatkan durasi pemeriksaan, probabilitas pendeteksian kesalahan berkurang yaitu aliran mengurangi kegagalan, kemudian dengan memeriksa aliran ini kita akan menentukan tahap mana yang didahulukan, sesuai aturan, di mana kepadatan kegagalan lebih sering, kita akan menempatkan tahap itu terlebih dahulu.

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Pic.15

Dari rumus pada Gambar 15 dapat disimpulkan bahwa tahap keempat sebaiknya ditempatkan dalam perhitungan sebelum tahap 2.2.

Dengan menggunakan rumus Schumann, kami menentukan perkiraan jumlah kesalahan awal:

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Pic.16

Dari hasil Gambar 16 terlihat bahwa prediksi jumlah error adalah N2 = 3167, lebih dari kriteria minimal yaitu 1459.

Hasil koreksi tersebut, kami mengoreksi 805 kesalahan, dan angka prediksinya adalah 3167 – 805 = 2362, masih lebih dari ambang batas minimum yang kami terima.

Kami mendefinisikan parameter C, lambda, dan fungsi keandalan:

Bersihkan data seperti permainan Batu, Kertas, Gunting. Apakah ini permainan dengan atau tanpa akhir? Bagian 2. Praktis
Pic.17

Pada dasarnya, lambda adalah indikator aktual dari intensitas deteksi kesalahan pada setiap tahap. Jika Anda melihat di atas, perkiraan sebelumnya untuk indikator ini adalah 42,4 kesalahan per jam, yang cukup sebanding dengan indikator Schumann. Beralih ke bagian pertama materi ini, ditentukan bahwa tingkat di mana pengembang menemukan kesalahan tidak boleh lebih rendah dari 1 kesalahan per 250,4 catatan, ketika memeriksa 1 catatan per menit. Oleh karena itu nilai kritis lambda untuk model Schumann:
60 / 250,4 = 0,239617.

Artinya, kebutuhan untuk melakukan prosedur deteksi kesalahan harus dilakukan hingga lambda dari yang ada 38,964 turun menjadi 0,239617.

Atau sampai indikator N (potensi jumlah kesalahan) dikurangi n (jumlah kesalahan yang dikoreksi) turun di bawah ambang batas yang kami terima (pada bagian pertama) - 1459 pcs.

Bagian 1. Teoritis.

Sumber: www.habr.com

Tambah komentar