Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

В Bölüm Bir bu yayının Hantı-Mansi Özerk Okrugu'ndaki gayrimenkullerin kadastro değerleme sonuçlarına ilişkin bir veri seti esas alınarak yapıldığı açıklandı.

Pratik kısım adımlar halinde sunulmaktadır. En yaygın araç ve açıklanan işlemler Excel'i bilen çoğu uzman tarafından tekrarlanabildiğinden, tüm temizlik Excel'de yapıldı. Ve el ele çalışmaya oldukça uygundur.

Sıfır aşaması, 100 MB boyutunda olduğu için dosyayı başlatma ve kaydetme işi olacaktır, daha sonra bu işlemlerin sayısı onlarca ve yüzlerce olduğundan önemli ölçüde zaman alır.
Açılış ortalama 30 saniyedir.
Kaydetme – 22 sn.

İlk aşama veri setinin istatistiksel göstergelerinin belirlenmesiyle başlar.

Tablo 1. Veri setinin istatistiksel göstergeleri
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

Teknoloji 2.1.

Yardımcı bir alan yaratıyoruz, onu AY numarasının altında tutuyorum. Her giriş için “=UZUNLUK(F365502)+UZUNLUK(G365502)+…+UZUNLUK(AW365502)” formülünü oluşturuyoruz.

Aşama 2.1'de harcanan toplam süre (Schumann formülü için) t21 = 1 saat.
Aşama 2.1'de bulunan hata sayısı (Schumann formülü için) n21 = 0 adet.

İkinci aşama.
Veri kümesinin bileşenlerinin kontrol edilmesi.
2.2. Kayıtlardaki tüm değerler standart semboller kullanılarak oluşturulmuştur. Bu nedenle istatistikleri sembollerle takip edelim.

Tablo 2. Sonuçların ön analizi ile veri setindeki karakterlerin istatistiksel göstergeleri.Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

Teknoloji 2.2.1.

Yardımcı bir alan yaratıyoruz - “alfa1”. Her kayıt için “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)” formülünü oluşturuyoruz.
Sabit bir Omega-1 hücresi oluşturuyoruz. Bu hücreye dönüşümlü olarak Windows-1251'e göre 32'den 255'e kadar karakter kodlarını gireceğiz.
Yardımcı bir alan yaratıyoruz - “alfa2”. “=BUL(SİMGE(Omega,1); “alfa1”,N)” formülüyle.
Yardımcı bir alan yaratıyoruz - “alfa3”. “=EĞER(EĞERSAYISI(“alfa2”,N),1)” formülüyle
“=SUM(“alpha2”N3: “alpha1”N3)” formülüyle sabit bir “Omega-365498” hücresi oluşturun

Tablo 3. Sonuçların ön analiz sonuçlarıTaş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

Tablo 4. Bu aşamada kaydedilen hatalarTaş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

Aşama 2.2.1'de harcanan toplam süre (Schumann formülü için) t221 = 8 saat.
Aşama 2.2.1'de düzeltilen hata sayısı (Schumann formülü için) n221 = 0 adet.

3 Adım.
Üçüncü adım, veri kümesinin durumunun kaydedilmesidir. Her kayda benzersiz bir numara (ID) ve her alana atayarak. Dönüştürülen veri kümesini orijinal veri kümesiyle karşılaştırmak için bu gereklidir. Bu aynı zamanda gruplama ve filtreleme özelliklerinden tam olarak yararlanmak için de gereklidir. Burada yine tablo 2.2.2'ye dönüyoruz ve veri setinde kullanılmayan bir sembolü seçiyoruz. Şekil 10'da gösterileni elde ederiz.

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Şekil 10. Tanımlayıcıların atanması.

Aşama 3'de harcanan toplam süre (Schumann formülü için) t3 = 0,75 saat.
Aşama 3'de bulunan hata sayısı (Schumann formülü için) n3 = 0 adet.

Çünkü Schumann formülü aşamanın hataların düzeltilerek tamamlanmasını gerektirmektedir. 2. aşamaya dönelim.

2.2.2 Adım.
Bu adımda ikili ve üçlü boşlukları da düzelteceğiz.
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Şekil 11. Çift boşluk sayısı.

Tablo 2.2.4'te tanımlanan hataların düzeltilmesi.

Tablo 5. Hata düzeltme aşamasıTaş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

“e” veya “e” harflerinin kullanılması gibi bir hususun neden önemli olduğuna dair bir örnek Şekil 12'de sunulmaktadır.

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Şekil 12. "E" harfindeki tutarsızlık.

Adım 2.2.2 t222'de harcanan toplam süre = 4 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.

Dördüncü aşama.
Alan yedekliliğinin kontrol edilmesi bu aşamaya çok iyi uyar. 44 alandan 6 alan:
7 - Yapının amacı
16 — Yer altı kat sayısı
17 - Ana nesne
21 - Köy Meclisi
38 — Yapı parametreleri (açıklama)
40 – Kültürel miras

Herhangi bir girişleri yok. Yani gereksizdirler.
“22 – Şehir” alanının tek girişi vardır, Şekil 13.

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Şekil 13. “Şehir” alanındaki tek giriş Z_348653'tür.

“34 - Bina adı” alanı, alanın amacına açıkça uymayan girişler içermektedir, Şekil 14.

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Şekil 14. Uygun olmayan bir giriş örneği.

Bu alanları veri kümesinden hariç tutuyoruz. Ve değişikliği 214 kayda kaydediyoruz.

Aşama 4'de harcanan toplam süre (Schumann formülü için) t4 = 2,5 saat.
Aşama 4'de bulunan hata sayısı (Schumann formülü için) n4 = 222 adet.

Tablo 6. 4. Aşama Sonrası Veri Seti Göstergelerinin Analizi

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik

Genel olarak göstergelerdeki değişimleri analiz ettiğimizde (Tablo 6) şunu söyleyebiliriz:
1) Ortalama sembol sayısının standart sapma koluna oranı 3'e yakındır, yani normal dağılım işaretleri vardır (altı sigma kuralı).
2) Minimum ve maksimum kaldıraçların ortalama kaldıraçtan önemli ölçüde sapması, kuyrukların incelenmesinin hata ararken umut verici bir yön olduğunu göstermektedir.

Schumann'ın metodolojisini kullanarak hata bulmanın sonuçlarını inceleyelim.

Boş aşamalar

2.1. Aşama 2.1'de harcanan toplam süre (Schumann formülü için) t21 = 1 saat.
Aşama 2.1'de bulunan hata sayısı (Schumann formülü için) n21 = 0 adet.

3. Aşama 3'de harcanan toplam süre (Schumann formülü için) t3 = 0,75 saat.
Aşama 3'de bulunan hata sayısı (Schumann formülü için) n3 = 0 adet.

Etkili aşamalar
2.2. Aşama 2.2.1'de harcanan toplam süre (Schumann formülü için) t221 = 8 saat.
Aşama 2.2.1'de düzeltilen hata sayısı (Schumann formülü için) n221 = 0 adet.
Adım 2.2.2 t222'de harcanan toplam süre = 4 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.

Adım 2.2'de harcanan toplam süre t22 = 8 + 4 = 12 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.

4. Aşama 4'de harcanan toplam süre (Schumann formülü için) t4 = 2,5 saat.
Aşama 4'de bulunan hata sayısı (Schumann formülü için) n4 = 222 adet.

Schumann modelinin ilk aşamasına dahil edilmesi gereken sıfır aşamalar olduğundan ve diğer yandan aşama 2.2 ve 4 doğası gereği bağımsız olduğundan Schumann modeli, kontrolün süresini artırarak olasılığın arttığını varsayar. hatanın azaldığını tespit edersek yani akışın arızaları azalır, daha sonra bu akışı inceleyerek hangi aşamayı ilk sıraya koyacağımızı belirleyeceğiz, kurala göre arıza yoğunluğunun daha sık olduğu yerde o aşamayı ilk sıraya koyacağız.

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Rys.15.

Şekil 15'teki formülden, hesaplamalarda dördüncü aşamanın aşama 2.2'den önce yerleştirilmesinin tercih edildiği anlaşılmaktadır.

Schumann formülünü kullanarak tahmini başlangıç ​​hata sayısını belirleriz:

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Rys.16.

Şekil 16'daki sonuçlardan, tahmin edilen hata sayısının N2 = 3167 olduğu ve bunun minimum kriter olan 1459'dan daha fazla olduğu görülmektedir.

Düzeltme sonucunda 805 hatayı düzelttik ve tahmin edilen sayı 3167 – 805 = 2362 olarak kabul ettiğimiz minimum eşiğin hala üzerinde.

C parametresini, lambdayı ve güvenilirlik fonksiyonunu tanımlıyoruz:

Taş, Kağıt, Makas oyunu gibi verileri temizleyin. Bu sonu olan mı yoksa sonu olmayan bir oyun mu? Bölüm 2. Pratik
Rys.17.

Esas olarak lambda, her aşamada hataların tespit edilme yoğunluğunun gerçek bir göstergesidir. Yukarıya bakarsanız, bu göstergenin önceki tahmini saatte 42,4 hataydı ve bu da Schumann göstergesiyle oldukça karşılaştırılabilir. Bu materyalin ilk kısmına dönersek, geliştiricinin dakikada 1 kayıt kontrol ederken hata bulma oranının 250,4 kayıt başına 1 hatadan az olmaması gerektiği belirlendi. Dolayısıyla Schumann modeli için lambda'nın kritik değeri:
60 / 250,4 = 0,239617.

Yani hata tespit prosedürlerinin yürütülmesi ihtiyacı, mevcut 38,964'ten lambda 0,239617'ye düşene kadar sürdürülmelidir.

Veya N göstergesi (potansiyel hata sayısı) eksi n (düzeltilmiş hata sayısı) kabul ettiğimiz eşiğin (ilk bölümde) - 1459 adet altına düşene kadar.

Bölüm 1. Teorik.

Kaynak: habr.com

Yorum ekle