Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

В bagian hiji ieu dijelaskeun yén ieu publikasi dijieun dina dasar susunan data hasil pangajen cadastral real estate di Khanty-Mansi Otonom Okrug.

Bagian praktis dipidangkeun dina wangun léngkah. Sadaya beberesih dilakukeun dina Excel, sabab alat anu paling umum sareng operasi anu dijelaskeun tiasa diulang ku seueur spesialis anu terang Excel. Sarta cukup ogé cocog pikeun gawé leungeun-ka-leungeun.

Tahap enol bakal dianggo pikeun ngaluncurkeun sareng nyimpen file, sabab ukuranana 100 MB, teras kalayan jumlah operasi ieu puluhan sareng ratusan, aranjeunna peryogi waktos anu penting.
Bubuka, rata-rata, 30 detik.
Nyimpen - 22 detik.

Tahap kahiji dimimitian ku nangtukeun indikator statistik tina dataset.

Tabél 1. Indikator statistik tina susunan data
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Téhnologi 2.1.

Urang nyieun hiji widang bantu, Kuring boga eta handapeun angka - AY. Pikeun unggal éntri, urang ngabentuk rumus "= PANJANG(F365502)+PANJANG(G365502)+...+PANJANG(AW365502)"

Total waktos spent di panggung 2.1 (pikeun rumus Schumann) t21 = 1 jam.
Jumlah kasalahan kapanggih dina tahap 2.1 (pikeun rumus Schumann) n21 = 0 PCS.

Fase kadua.
Mariksa komponén tina susunan data.
2.2. Sadaya nilai dina rékaman dibentuk nganggo simbol standar. Ku alatan éta, hayu urang ngalacak statistik ku simbol.

Tabél 2. Indikator statistik karakter dina dataset kalawan analisis awal hasil.Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Téhnologi 2.2.1.

Urang nyieun hiji widang bantu - "alpha1". Pikeun unggal catetan, urang ngabentuk rumus "=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)"
Urang nyieun sél Omega-1 tetep. Urang gantian ngasupkeun kodeu karakter nurutkeun Windows-1251 ti 32 nepi ka 255 kana sél ieu.
Urang nyieun hiji widang bantu - "alpha2". Kalayan rumus "= PANGGILAN(SIMBOL(Omega,1);"alfa1",N)".
Urang nyieun hiji widang bantu - "alpha3". Kalayan rumus "=IF(ISNUMBER("alpha2",N),1)"
Jieun sél tetep "Omega-2", kalayan rumus "=SUM("alpha3"N1: "alpha3"N365498)"

Tabél 3. Hasil analisis awal hasilNgabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Méja 4. Kasalahan dirékam dina tahap ieuNgabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Total waktos spent di panggung 2.2.1 (pikeun rumus Schumann) t221 = 8 jam.
Jumlah kasalahan dilereskeun dina tahap 2.2.1 (pikeun rumus Schumann) n221 = 0 PCS.

Tahap 3.
Léngkah katilu nyaéta ngarékam kaayaan set data. Ku assigning unggal rékaman angka unik (ID) jeung unggal widang. Ieu diperlukeun pikeun ngabandingkeun dataset dirobah kalawan aslina. Ieu ogé diperlukeun pikeun ngamangpaatkeun pinuh kamampuhan grouping jeung nyaring. Di dieu deui urang giliran tabel 2.2.2 tur pilih simbol nu teu dipaké dina dataset nu. Kami nampi naon anu dipidangkeun dina Gambar 10.

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 10. Assigning identifiers.

Total waktos spent di panggung 3 (pikeun rumus Schumann) t3 = 0,75 jam.
Jumlah kasalahan kapanggih dina tahap 3 (pikeun rumus Schumann) n3 = 0 PCS.

Kusabab rumus Schumann ngabutuhkeun yén tahapan réngsé ku ngabenerkeun kasalahan. Hayu urang balik ka tahap 2.

Tahap 2.2.2.
Dina léngkah ieu kami ogé bakal ngabenerkeun spasi ganda sareng rangkep tilu.
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 11. Jumlah spasi ganda.

Koréksi kasalahan anu diidentifikasi dina tabél 2.2.4.

Méja 5. Tahap koreksi kasalahanNgabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Conto naha aspék sapertos panggunaan hurup "e" atanapi "e" penting dipidangkeun dina Gambar 12.

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 12. Kasalahan dina hurup "e".

Total waktos spent dina hambalan 2.2.2 t222 = 4 jam.
Jumlah kasalahan kapanggih dina tahap 2.2.2 (pikeun rumus Schumann) n222 = 583 PCS.

Tahap kaopat.
Mariksa redundansi widang cocog ogé kana tahap ieu. Tina 44 widang, 6 widang:
7 - Tujuan tina struktur
16 - Jumlah lanté bawah tanah
17 - Obyék kolot
21 - Déwan Désa
38 - Parameter struktur (deskripsi)
40 - Warisan Budaya

Aranjeunna teu gaduh éntri. Maksudna, aranjeunna kaleuleuwihan.
Widang "22 - Kota" gaduh hiji éntri tunggal, Gambar 13.

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 13. Hiji-hijina éntri nyaéta Z_348653 dina widang "Kota".

Widang "34 - Ngaran Gedong" ngandung éntri anu jelas henteu saluyu sareng tujuan lapangan, Gambar 14.

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 14. Conto éntri anu henteu patuh.

Urang ngaluarkeun widang ieu tina dataset. Sareng urang ngarékam parobihan dina 214 rékaman.

Total waktos spent di panggung 4 (pikeun rumus Schumann) t4 = 2,5 jam.
Jumlah kasalahan kapanggih dina tahap 4 (pikeun rumus Schumann) n4 = 222 PCS.

Tabél 6. Analisis indikator susunan data sanggeus tahap ka-4

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis

Sacara umum, analisa parobahan dina indikator (Tabel 6) urang tiasa nyarios yén:
1) Babandingan jumlah rata-rata lambang jeung tuas simpangan baku deukeut ka 3, nyaéta, aya tanda-tanda distribusi normal (aturan genep sigma).
2) Panyimpangan anu signifikan tina pengungkit minimum sareng maksimal tina uas rata-rata nunjukkeun yén ulikan buntut mangrupikeun arah anu ngajangjikeun nalika milarian kasalahan.

Hayu urang nalungtik hasil manggihan kasalahan ngagunakeun metodologi Schumann urang.

Tahap dianggurkeun

2.1. Total waktos spent di panggung 2.1 (pikeun rumus Schumann) t21 = 1 jam.
Jumlah kasalahan kapanggih dina tahap 2.1 (pikeun rumus Schumann) n21 = 0 PCS.

3. Total waktos spent di panggung 3 (pikeun rumus Schumann) t3 = 0,75 jam.
Jumlah kasalahan kapanggih dina tahap 3 (pikeun rumus Schumann) n3 = 0 PCS.

Tahap éféktif
2.2. Total waktos spent di panggung 2.2.1 (pikeun rumus Schumann) t221 = 8 jam.
Jumlah kasalahan dilereskeun dina tahap 2.2.1 (pikeun rumus Schumann) n221 = 0 PCS.
Total waktos spent dina hambalan 2.2.2 t222 = 4 jam.
Jumlah kasalahan kapanggih dina tahap 2.2.2 (pikeun rumus Schumann) n222 = 583 PCS.

Total waktos spent dina hambalan 2.2 t22 = 8 + 4 = 12 jam.
Jumlah kasalahan kapanggih dina tahap 2.2.2 (pikeun rumus Schumann) n222 = 583 PCS.

4. Total waktos spent di panggung 4 (pikeun rumus Schumann) t4 = 2,5 jam.
Jumlah kasalahan kapanggih dina tahap 4 (pikeun rumus Schumann) n4 = 222 PCS.

Kusabab aya enol tahapan anu kedah dilebetkeun kana tahap kahiji model Schumann, sareng di sisi anu sanés, tahap 2.2 sareng 4 sacara inherently mandiri, teras nunjukkeun yén modél Schumann nganggap yén ku cara ningkatkeun durasi pamariksaan, kamungkinan kamungkinan. tina ngadeteksi kasalahan nurun, nyaeta, aliran nurun gagal, lajeng ku examining aliran ieu urang bakal nangtukeun mana tahapan nunda heula, nurutkeun aturan, dimana dénsitas gagalna leuwih sering, urang bakal nempatkeun éta tahap kahiji.

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 15.

Tina rumus dina Gambar 15 ieu di handap ieu anu leuwih hade nempatkeun tahap kaopat saméméh tahap 2.2 dina itungan.

Ngagunakeun rumus Schumann, urang nangtukeun estimasi jumlah awal kasalahan:

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 16.

Tina hasil dina Gambar 16 bisa katitén yén prediksi jumlah kasalahan nyaéta N2 = 3167, nu leuwih ti kritéria minimum 1459.

Salaku hasil tina koreksi, urang dilereskeun 805 kasalahan, sarta jumlah diprediksi nyaeta 3167 - 805 = 2362, nu masih leuwih ti bangbarung minimum kami katampa.

Urang nangtukeun parameter C, lambda jeung fungsi reliabilitas:

Ngabersihan data sapertos kaulinan Rock, Paper, Gunting. Ieu kaulinan kalayan atawa tanpa tungtung? Bagian 2. Praktis
Gbr. 17.

Intina, lambda mangrupikeun indikator saleresna tina inténsitas dimana kasalahan dideteksi dina unggal tahapan. Lamun kasampak di luhur, estimasi saméméhna tina indikator ieu 42,4 kasalahan per jam, nu rada comparable kana indikator Schumann. Ngahurungkeun bagian mimiti bahan ieu, éta ditangtukeun yén laju pamekar manggihan kasalahan teu kudu leuwih handap 1 kasalahan per 250,4 rékaman, nalika mariksa 1 catetan per menit. Ku kituna nilai kritis lambda pikeun modél Schumann:
60 / 250,4 = 0,239617.

Hartina, kabutuhan pikeun ngalaksanakeun prosedur deteksi kasalahan kedah dilaksanakeun dugi ka lambda, tina 38,964 anu aya, turun ka 0,239617.

Atawa nepi ka indikator N (jumlah poténsi kasalahan) dikurangan n (jumlah dilereskeun kasalahan) nurun handap bangbarung kami katampa (dina bagian kahiji) - 1459 PCS.

Bagian 1. Téoritis.

sumber: www.habr.com

Tambahkeun komentar