В
Pratik kısım adımlar halinde sunulmaktadır. En yaygın araç ve açıklanan işlemler Excel'i bilen çoğu uzman tarafından tekrarlanabildiğinden, tüm temizlik Excel'de yapıldı. Ve el ele çalışmaya oldukça uygundur.
Sıfır aşaması, 100 MB boyutunda olduğu için dosyayı başlatma ve kaydetme işi olacaktır, daha sonra bu işlemlerin sayısı onlarca ve yüzlerce olduğundan önemli ölçüde zaman alır.
Açılış ortalama 30 saniyedir.
Kaydetme – 22 sn.
İlk aşama veri setinin istatistiksel göstergelerinin belirlenmesiyle başlar.
Tablo 1. Veri setinin istatistiksel göstergeleri
Teknoloji 2.1.
Yardımcı bir alan yaratıyoruz, onu AY numarasının altında tutuyorum. Her giriş için “=UZUNLUK(F365502)+UZUNLUK(G365502)+…+UZUNLUK(AW365502)” formülünü oluşturuyoruz.
Aşama 2.1'de harcanan toplam süre (Schumann formülü için) t21 = 1 saat.
Aşama 2.1'de bulunan hata sayısı (Schumann formülü için) n21 = 0 adet.
İkinci aşama.
Veri kümesinin bileşenlerinin kontrol edilmesi.
2.2. Kayıtlardaki tüm değerler standart semboller kullanılarak oluşturulmuştur. Bu nedenle istatistikleri sembollerle takip edelim.
Tablo 2. Sonuçların ön analizi ile veri setindeki karakterlerin istatistiksel göstergeleri.
Teknoloji 2.2.1.
Yardımcı bir alan yaratıyoruz - “alfa1”. Her kayıt için “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)” formülünü oluşturuyoruz.
Sabit bir Omega-1 hücresi oluşturuyoruz. Bu hücreye dönüşümlü olarak Windows-1251'e göre 32'den 255'e kadar karakter kodlarını gireceğiz.
Yardımcı bir alan yaratıyoruz - “alfa2”. “=BUL(SİMGE(Omega,1); “alfa1”,N)” formülüyle.
Yardımcı bir alan yaratıyoruz - “alfa3”. “=EĞER(EĞERSAYISI(“alfa2”,N),1)” formülüyle
“=SUM(“alpha2”N3: “alpha1”N3)” formülüyle sabit bir “Omega-365498” hücresi oluşturun
Tablo 3. Sonuçların ön analiz sonuçları
Tablo 4. Bu aşamada kaydedilen hatalar
Aşama 2.2.1'de harcanan toplam süre (Schumann formülü için) t221 = 8 saat.
Aşama 2.2.1'de düzeltilen hata sayısı (Schumann formülü için) n221 = 0 adet.
3 Adım.
Üçüncü adım, veri kümesinin durumunun kaydedilmesidir. Her kayda benzersiz bir numara (ID) ve her alana atayarak. Dönüştürülen veri kümesini orijinal veri kümesiyle karşılaştırmak için bu gereklidir. Bu aynı zamanda gruplama ve filtreleme özelliklerinden tam olarak yararlanmak için de gereklidir. Burada yine tablo 2.2.2'ye dönüyoruz ve veri setinde kullanılmayan bir sembolü seçiyoruz. Şekil 10'da gösterileni elde ederiz.
Şekil 10. Tanımlayıcıların atanması.
Aşama 3'de harcanan toplam süre (Schumann formülü için) t3 = 0,75 saat.
Aşama 3'de bulunan hata sayısı (Schumann formülü için) n3 = 0 adet.
Çünkü Schumann formülü aşamanın hataların düzeltilerek tamamlanmasını gerektirmektedir. 2. aşamaya dönelim.
2.2.2 Adım.
Bu adımda ikili ve üçlü boşlukları da düzelteceğiz.
Şekil 11. Çift boşluk sayısı.
Tablo 2.2.4'te tanımlanan hataların düzeltilmesi.
Tablo 5. Hata düzeltme aşaması
“e” veya “e” harflerinin kullanılması gibi bir hususun neden önemli olduğuna dair bir örnek Şekil 12'de sunulmaktadır.
Şekil 12. "E" harfindeki tutarsızlık.
Adım 2.2.2 t222'de harcanan toplam süre = 4 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.
Dördüncü aşama.
Alan yedekliliğinin kontrol edilmesi bu aşamaya çok iyi uyar. 44 alandan 6 alan:
7 - Yapının amacı
16 — Yer altı kat sayısı
17 - Ana nesne
21 - Köy Meclisi
38 — Yapı parametreleri (açıklama)
40 – Kültürel miras
Herhangi bir girişleri yok. Yani gereksizdirler.
“22 – Şehir” alanının tek girişi vardır, Şekil 13.
Şekil 13. “Şehir” alanındaki tek giriş Z_348653'tür.
“34 - Bina adı” alanı, alanın amacına açıkça uymayan girişler içermektedir, Şekil 14.
Şekil 14. Uygun olmayan bir giriş örneği.
Bu alanları veri kümesinden hariç tutuyoruz. Ve değişikliği 214 kayda kaydediyoruz.
Aşama 4'de harcanan toplam süre (Schumann formülü için) t4 = 2,5 saat.
Aşama 4'de bulunan hata sayısı (Schumann formülü için) n4 = 222 adet.
Tablo 6. 4. Aşama Sonrası Veri Seti Göstergelerinin Analizi
Genel olarak göstergelerdeki değişimleri analiz ettiğimizde (Tablo 6) şunu söyleyebiliriz:
1) Ortalama sembol sayısının standart sapma koluna oranı 3'e yakındır, yani normal dağılım işaretleri vardır (altı sigma kuralı).
2) Minimum ve maksimum kaldıraçların ortalama kaldıraçtan önemli ölçüde sapması, kuyrukların incelenmesinin hata ararken umut verici bir yön olduğunu göstermektedir.
Schumann'ın metodolojisini kullanarak hata bulmanın sonuçlarını inceleyelim.
Boş aşamalar
2.1. Aşama 2.1'de harcanan toplam süre (Schumann formülü için) t21 = 1 saat.
Aşama 2.1'de bulunan hata sayısı (Schumann formülü için) n21 = 0 adet.
3. Aşama 3'de harcanan toplam süre (Schumann formülü için) t3 = 0,75 saat.
Aşama 3'de bulunan hata sayısı (Schumann formülü için) n3 = 0 adet.
Etkili aşamalar
2.2. Aşama 2.2.1'de harcanan toplam süre (Schumann formülü için) t221 = 8 saat.
Aşama 2.2.1'de düzeltilen hata sayısı (Schumann formülü için) n221 = 0 adet.
Adım 2.2.2 t222'de harcanan toplam süre = 4 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.
Adım 2.2'de harcanan toplam süre t22 = 8 + 4 = 12 saat.
Aşama 2.2.2'de bulunan hata sayısı (Schumann formülü için) n222 = 583 adet.
4. Aşama 4'de harcanan toplam süre (Schumann formülü için) t4 = 2,5 saat.
Aşama 4'de bulunan hata sayısı (Schumann formülü için) n4 = 222 adet.
Schumann modelinin ilk aşamasına dahil edilmesi gereken sıfır aşamalar olduğundan ve diğer yandan aşama 2.2 ve 4 doğası gereği bağımsız olduğundan Schumann modeli, kontrolün süresini artırarak olasılığın arttığını varsayar. hatanın azaldığını tespit edersek yani akışın arızaları azalır, daha sonra bu akışı inceleyerek hangi aşamayı ilk sıraya koyacağımızı belirleyeceğiz, kurala göre arıza yoğunluğunun daha sık olduğu yerde o aşamayı ilk sıraya koyacağız.
Rys.15.
Şekil 15'teki formülden, hesaplamalarda dördüncü aşamanın aşama 2.2'den önce yerleştirilmesinin tercih edildiği anlaşılmaktadır.
Schumann formülünü kullanarak tahmini başlangıç hata sayısını belirleriz:
Rys.16.
Şekil 16'daki sonuçlardan, tahmin edilen hata sayısının N2 = 3167 olduğu ve bunun minimum kriter olan 1459'dan daha fazla olduğu görülmektedir.
Düzeltme sonucunda 805 hatayı düzelttik ve tahmin edilen sayı 3167 – 805 = 2362 olarak kabul ettiğimiz minimum eşiğin hala üzerinde.
C parametresini, lambdayı ve güvenilirlik fonksiyonunu tanımlıyoruz:
Rys.17.
Esas olarak lambda, her aşamada hataların tespit edilme yoğunluğunun gerçek bir göstergesidir. Yukarıya bakarsanız, bu göstergenin önceki tahmini saatte 42,4 hataydı ve bu da Schumann göstergesiyle oldukça karşılaştırılabilir. Bu materyalin ilk kısmına dönersek, geliştiricinin dakikada 1 kayıt kontrol ederken hata bulma oranının 250,4 kayıt başına 1 hatadan az olmaması gerektiği belirlendi. Dolayısıyla Schumann modeli için lambda'nın kritik değeri:
60 / 250,4 = 0,239617.
Yani hata tespit prosedürlerinin yürütülmesi ihtiyacı, mevcut 38,964'ten lambda 0,239617'ye düşene kadar sürdürülmelidir.
Veya N göstergesi (potansiyel hata sayısı) eksi n (düzeltilmiş hata sayısı) kabul ettiğimiz eşiğin (ilk bölümde) - 1459 adet altına düşene kadar.
Kaynak: habr.com