1. İlkin məlumatlar
Məlumatların təmizlənməsi məlumatların təhlili tapşırıqlarının qarşısında duran problemlərdən biridir. Bu materialda kadastr dəyərinin formalaşmasında məlumat bazasının təhlilinin praktiki probleminin həlli nəticəsində yaranan inkişaflar və həllər öz əksini tapmışdır. Mənbələr burada
“Əlavə B. KS-nin müəyyən edilməsinin nəticələri 5. Kadastr dəyərinin müəyyən edilməsi metodu haqqında məlumat 5.1 Müqayisəli yanaşma”da “Müqayisəli model cəmi.ods” faylına baxılmışdır.
Cədvəl 1. “Müqayisəli model total.ods” faylında verilənlər toplusunun statistik göstəriciləri
Sahələrin ümumi sayı, ədəd. - 44
Qeydlərin ümumi sayı, ədəd. - 365 490
Simvolların ümumi sayı, ədəd. — 101 714 693
Yazıdakı simvolların orta sayı, ədəd. — 278,297
Rekorddakı simvolların standart sapması, ədəd. — 15,510
Girişdəki simvolların minimum sayı, ədəd. - 198
Girişdəki simvolların maksimum sayı, ədəd. - 363
2. Giriş hissəsi. Əsas standartlar
Göstərilən verilənlər bazası təhlil edilərkən, təmizlənmə dərəcəsinə olan tələbləri müəyyən etmək üçün tapşırıq formalaşdırıldı, çünki hər kəsə aydın olduğu kimi, göstərilən məlumat bazası istifadəçilər üçün hüquqi və iqtisadi nəticələr yaradır. İş zamanı məlum oldu ki, böyük verilənlərin təmizlənməsi dərəcəsi üçün heç bir xüsusi tələblər yoxdur. Bu məsələdə hüquq normalarını təhlil edərək belə qənaətə gəldim ki, onların hamısı imkanlardan formalaşıb. Yəni müəyyən bir tapşırıq ortaya çıxdı, tapşırıq üçün məlumat mənbələri tərtib edilir, sonra verilənlər toplusu formalaşır və yaradılmış verilənlər bazası əsasında problemin həlli üçün alətlər yaradılır. Nəticə həllər alternativlərdən seçim edərkən istinad nöqtələridir. Bunu Şəkil 1-də təqdim etdim.
Hər hansı bir standartın müəyyənləşdirilməsi məsələlərində sübut edilmiş texnologiyalara etibar etmək daha məqsədəuyğun olduğu üçün mən bənddə göstərilən tələbləri seçdim.
Şəkil 2-də hüquq elmində məlumat növlərinə yanaşmaların formalaşması diaqramı təqdim olunur.
düyü. 2. Mənbə
Şəkil 3-də yuxarıdakı “Rəhbərliyin” tapşırıqları üçün Şəkil 1-in mexanizmi göstərilir. Müqayisə apararaq görmək asandır ki, informasiya sistemləri üçün müasir standartlarda informasiyanın bütövlüyünə dair tələblərə cavab verən zaman istifadə olunan yanaşmalar informasiyanın hüquqi anlayışı ilə müqayisədə xeyli məhduddur.
Şəkil 3
Göstərilən sənəddə (Rəhbərlik), texniki hissəyə qoşulma, məlumatların emalı və saxlanması imkanları 18.2-ci fəsildən bir sitatla yaxşı təsdiqlənir. Əlaqəli verilənlər bazası: "Bu fayl strukturu mahiyyət etibarilə daha təhlükəsizdir, çünki verilənlər verilənlər və metadata arasındakı əlaqəni qoruyan böyük fayl formatında saxlanılır."
Əslində, bu yanaşmada - mövcud texniki imkanlardan anormal heç nə yoxdur və özlüyündə bu, təbii prosesdir, çünki anlayışların genişlənməsi ən çox öyrənilən fəaliyyətdən - verilənlər bazası dizaynından irəli gəlir. Lakin, digər tərəfdən, mövcud sistemlərin texniki imkanlarına endirimləri nəzərdə tutmayan hüquqi normalar ortaya çıxır, məsələn:
düyü. 4. Texniki imkanların hunisi (
Bu aspektlərdə aydın olur ki, ilkin verilənlər toplusu (şək. 1) ilk növbədə saxlanmalı, ikincisi isə ondan əlavə məlumatların çıxarılması üçün əsas olmalıdır. Yaxşı, bir nümunə olaraq: yol hərəkəti qaydalarını qeyd edən kameralar hər yerdə mövcuddur, məlumat emal sistemləri pozucuları aradan qaldırır, lakin digər məlumatlar da digər istehlakçılara təklif edilə bilər, məsələn, bir ticarət mərkəzinə müştərilərin axınının strukturunun marketinq monitorinqi kimi. Və bu, BigDat istifadə edərkən əlavə əlavə dəyər mənbəyidir. Çox güman ki, indi, hardasa gələcəkdə toplanan məlumat dəstləri indiki vaxtda 1700-cü il nadir nəşrlərin dəyərinə bənzər mexanizmə görə dəyərə malik olacaq. Axı, əslində, müvəqqəti məlumat dəstləri unikaldır və gələcəkdə təkrarlanma ehtimalı azdır.
3. Giriş hissəsi. Qiymətləndirmə meyarı
Emal prosesi zamanı səhvlərin aşağıdakı təsnifatı hazırlanmışdır.
1. Səhv sinfi (GOST R 8.736-2011 əsasında): a) sistematik xətalar; b) təsadüfi səhvlər; c) kobud səhv.
2. Çoxluğa görə: a) mono təhrif; b) çox təhrif.
3. Nəticələrin kritikliyinə görə: a) kritik; b) kritik deyil.
4. Baş vermə mənbəyinə görə:
A) Texniki – avadanlığın istismarı zamanı baş verən xətalar. IoT sistemləri, rabitə keyfiyyətinə əhəmiyyətli dərəcədə təsir göstərən sistemlər, avadanlıq (aparat) üçün kifayət qədər uyğun bir səhv.
B) Operator xətaları - məlumatların daxil edilməsi zamanı operatorun hərf səhvlərindən tutmuş verilənlər bazasının dizaynı üçün texniki şərtlərdəki səhvlərə qədər geniş diapazonda olan xətalar.
C) İstifadəçi xətaları - burada bütün diapazondakı istifadəçi xətaları "düzmanı dəyişməyi unutdum"dan tutmuş sayğacların ayaqla səhv salınmasına qədərdir.
5. Ayrı bir sinifə ayrılır:
a) "separatorun tapşırığı", yəni boşluq və ":" (bizim vəziyyətimizdə) təkrarlandığı zaman;
b) birlikdə yazılmış sözlər;
c) xidmət simvollarından sonra boşluq yoxdur
d) simmetrik çoxlu simvollar: (), "", "...".
Şəkil 5-də təqdim olunan verilənlər bazası xətalarının sistemləşdirilməsi ilə birlikdə, səhvlərin axtarışı və bu nümunə üçün məlumatların təmizlənməsi alqoritminin hazırlanması üçün kifayət qədər effektiv koordinat sistemi formalaşır.
düyü. 5. Verilənlər bazasının struktur bölmələrinə uyğun gələn tipik səhvlər (Mənbə:
Dəqiqlik, Domain bütövlüyü, Məlumat növü, ardıcıllıq, artıqlıq, tamlıq, təkrarlama, biznes qaydalarına uyğunluq, struktur dəqiqliyi, məlumat anomaliyaları, aydınlıq, vaxtında, məlumatların bütövlüyü qaydalarına riayət etmək. (Səhifə 334. İT mütəxəssisləri üçün məlumat anbarının əsasları / Paulraj Ponniah.—2-ci nəşr.)
Mötərizədə ingilis dili və rusca maşın tərcüməsi təqdim olunur.
Dəqiqlik. Məlumat elementi üçün sistemdə saxlanılan dəyər verilənlər elementinin həmin baş verməsi üçün düzgün dəyərdir. Müştəri adınız və qeyddə saxlanmış ünvanınız varsa, o zaman ünvan həmin ada malik müştəri üçün düzgün ünvandır. Əgər 1000 nömrəli sifariş üçün qeyddə sifariş edilmiş miqdarı 12345678 vahid olaraq tapsanız, o zaman həmin miqdar həmin sifariş üçün dəqiq miqdardır.
[Dəqiqlik. Məlumat elementi üçün sistemdə saxlanılan dəyər verilənlər elementinin həmin baş verməsi üçün düzgün dəyərdir. Əgər qeyddə saxlanılan müştəri adınız və ünvanınız varsa, o zaman ünvan həmin ada malik müştəri üçün düzgün ünvandır. Əgər 1000 nömrəli sifariş üçün qeyddə sifariş edilmiş miqdarı 12345678 vahid olaraq tapsanız, o zaman həmin miqdar həmin sifariş üçün dəqiq miqdardır.]
Domain bütövlüyü. Bir atributun məlumat dəyəri icazə verilən, müəyyən edilmiş dəyərlər aralığına düşür. Ümumi nümunə, gender məlumat elementi üçün icazə verilən dəyərlər "kişi" və "qadın"dır.
[Domen bütövlüyü. Atribut məlumat dəyəri etibarlı, müəyyən edilmiş dəyərlər diapazonuna düşür. Ümumi nümunə gender məlumat elementi üçün etibarlı "kişi" və "qadın" dəyərləridir.]
Məlumat növü. Məlumat atributunun dəyəri əslində həmin atribut üçün müəyyən edilmiş məlumat növü kimi saxlanılır. Mağaza adı sahəsinin məlumat növü “mətn” kimi müəyyən edildikdə, həmin sahənin bütün nümunələri rəqəmsal kodlardan deyil, mətn formatında göstərilən mağaza adını ehtiva edir.
[Məlumat növü. Məlumat atributunun dəyəri əslində həmin atribut üçün müəyyən edilmiş məlumat növü kimi saxlanılır. Əgər mağaza adı sahəsinin məlumat növü "mətn" kimi müəyyən edilirsə, bu sahənin bütün nümunələri rəqəmsal kodlardan daha çox mətn formatında göstərilən mağaza adını ehtiva edir.]
Ardıcıllıq. Məlumat sahəsinin forması və məzmunu bir çox mənbə sistemlərində eynidir. Bir sistemdə ABC məhsulunun məhsul kodu 1234-dürsə, bu məhsulun kodu hər bir mənbə sistemində 1234-dür.
[Ardıcıllıq. Məlumat sahəsinin forması və məzmunu müxtəlif mənbə sistemlərində eynidir. Əgər bir sistemdə ABC məhsulunun məhsul kodu 1234-dürsə, o zaman həmin məhsulun kodu hər bir mənbə sistemində 1234-dür.]
Artıqlıq. Eyni məlumatlar sistemdə birdən çox yerdə saxlanılmamalıdır. Əgər səmərəlilik səbəbi ilə məlumat elementi qəsdən sistemdə birdən çox yerdə saxlanılırsa, artıqlıq aydın şəkildə müəyyən edilməli və yoxlanılmalıdır.
[İstehsalat. Eyni məlumatlar sistemdə birdən çox yerdə saxlanılmamalıdır. Əgər səmərəlilik səbəbi ilə məlumat elementi qəsdən sistemdə bir neçə yerdə saxlanılırsa, artıqlıq aydın şəkildə müəyyən edilməli və yoxlanılmalıdır.]
Tamlıq. Sistemdə verilmiş atribut üçün əskik dəyər yoxdur. Məsələn, müştəri faylında hər bir müştəri üçün “status” sahəsi üçün etibarlı dəyər olmalıdır. Sifariş təfərrüatları faylında sifariş üçün hər bir detal qeydi tam doldurulmalıdır.
[Tamlıq. Bu atribut üçün sistemdə əskik dəyər yoxdur. Məsələn, müştəri faylı hər bir müştəri üçün "status" sahəsi üçün etibarlı dəyərə malik olmalıdır. Sifariş təfərrüatları faylında hər bir sifariş təfərrüatının qeydi tamamilə doldurulmalıdır.]
Dublikasiya. Sistemdə qeydlərin təkrarlanması tamamilə həll edilir. Əgər məhsul faylında dublikat qeydlər olduğu məlumdursa, onda hər bir məhsul üçün bütün dublikat qeydlər müəyyən edilir və çarpaz arayış yaradılır.
[Dublikat. Sistemdə qeydlərin təkrarlanması tamamilə aradan qaldırılıb. Əgər məhsul faylında dublikat qeydlər olduğu bilinirsə, onda hər bir məhsul üçün bütün dublikat qeydlər müəyyən edilir və çarpaz istinad yaradılır.]
Biznes Qaydalarına Uyğunluq. Hər bir məlumat elementinin dəyərləri müəyyən edilmiş iş qaydalarına uyğundur. Hərrac sistemində çəkic və ya satış qiyməti ehtiyat qiymətdən aşağı ola bilməz. Bank kredit sistemində kredit qalığı həmişə müsbət və ya sıfır olmalıdır.
[İş qaydalarına uyğunluq. Hər bir məlumat elementinin dəyərləri müəyyən edilmiş iş qaydalarına uyğundur. Hərrac sistemində çəkic və ya satış qiyməti ehtiyat qiymətdən aşağı ola bilməz. Bank kredit sistemində kredit balansı həmişə müsbət və ya sıfır olmalıdır.]
Struktur Müəyyənlik. Məlumat elementinin təbii olaraq fərdi komponentlərə strukturlaşdırıla bildiyi yerdə, element bu yaxşı müəyyən edilmiş strukturu ehtiva etməlidir. Məsələn, bir şəxsin adı təbii olaraq ad, ata və soyad olaraq bölünür. Fiziki şəxslərin adları üçün dəyərlər ad, ata adı və soyad kimi saxlanmalıdır. Məlumat keyfiyyətinin bu xüsusiyyəti standartların tətbiqini asanlaşdırır və çatışmayan dəyərləri azaldır.
[Struktur Müəyyənlik. Məlumat elementi təbii olaraq fərdi komponentlərə strukturlaşdırıla bildiyi halda, element bu yaxşı müəyyən edilmiş strukturu ehtiva etməlidir. Məsələn, insanın adı təbii olaraq ad, atasının başlanğıcı və soyadına bölünür. Fərdi adlar üçün dəyərlər ad, ata adı və soyad kimi saxlanmalıdır. Bu məlumat keyfiyyəti xarakteristikası standartların tətbiqini asanlaşdırır və çatışmayan dəyərləri azaldır.]
Məlumat anomaliyası. Sahə yalnız müəyyən edildiyi məqsəd üçün istifadə edilməlidir. Əgər Ünvan-3 sahəsi uzun ünvanlar üçün hər hansı mümkün üçüncü ünvan sətri üçün müəyyən edilibsə, onda bu sahə yalnız üçüncü ünvan sətirinin qeydi üçün istifadə edilməlidir. Müştəri üçün telefon və ya faks nömrəsini daxil etmək üçün istifadə edilməməlidir.
[Məlumat anomaliyası. Sahə yalnız müəyyən edildiyi məqsəd üçün istifadə edilməlidir. Əgər Ünvan-3 sahəsi uzun ünvanlar üçün hər hansı mümkün üçüncü ünvan sətri üçün müəyyən edilmişdirsə, onda bu sahə yalnız üçüncü ünvan xəttini qeyd etmək üçün istifadə edilməlidir. Müştəri üçün telefon və ya faks nömrəsini daxil etmək üçün istifadə edilməməlidir.]
Aydınlıq. Məlumat elementi keyfiyyətli məlumatın bütün digər xüsusiyyətlərinə malik ola bilər, lakin istifadəçilər onun mənasını aydın başa düşmürlərsə, məlumat elementinin istifadəçilər üçün heç bir dəyəri yoxdur. Düzgün adlandırma konvensiyaları məlumat elementlərinin istifadəçilər tərəfindən yaxşı başa düşülməsinə kömək edir.
[Aydınlıq. Məlumat elementi yaxşı verilənlərin bütün digər xüsusiyyətlərinə malik ola bilər, lakin istifadəçilər onun mənasını aydın başa düşmürlərsə, məlumat elementinin istifadəçilər üçün heç bir dəyəri yoxdur. Düzgün adlandırma konvensiyaları məlumat elementlərinin istifadəçilər tərəfindən yaxşı başa düşülməsinə kömək edir.]
Vaxtında. İstifadəçilər məlumatların vaxtında olmasını müəyyənləşdirirlər. Əgər istifadəçilər müştəri ölçüsü məlumatlarının bir gündən köhnə olmamasını gözləyirlərsə, mənbə sistemlərində müştəri məlumatlarına edilən dəyişikliklər hər gün məlumat anbarına tətbiq edilməlidir.
[Vaxtında. İstifadəçilər məlumatların vaxtında olmasını müəyyənləşdirirlər. İstifadəçilər müştəri ölçüsü məlumatlarının bir gündən çox olmamasını gözləyirlərsə, mənbə sistemlərindəki müştəri məlumatlarına edilən dəyişikliklər gündəlik olaraq məlumat anbarına tətbiq edilməlidir.]
Faydalılıq. Məlumat anbarındakı hər bir məlumat elementi istifadəçilərin toplanmasının bəzi tələblərinə cavab verməlidir. Məlumat elementi dəqiq və yüksək keyfiyyətli ola bilər, lakin istifadəçilər üçün heç bir dəyəri yoxdursa, o zaman həmin məlumat elementinin məlumat anbarında olması tamamilə lazımsızdır.
[Utility. Məlumat anbarındakı hər bir məlumat elementi istifadəçi kolleksiyasının bəzi tələblərinə cavab verməlidir. Məlumat elementi dəqiq və yüksək keyfiyyətli ola bilər, lakin o, istifadəçilərə dəyər vermirsə, o zaman həmin məlumat elementinin məlumat anbarında olması vacib deyil.]
Məlumatların bütövlüyü qaydalarına riayət edilməsi. Mənbə sistemlərinin əlaqəli verilənlər bazalarında saxlanılan məlumatlar obyekt bütövlüyü və istinad bütövlüyü qaydalarına uyğun olmalıdır. Əsas açar kimi null-a icazə verən hər hansı bir cədvəl obyektin bütövlüyünə malik deyil. Referensial dürüstlük valideyn-övlad münasibətlərini düzgün qurmağa məcbur edir. Müştəri-sifariş münasibətində istinad bütövlüyü verilənlər bazasında hər sifariş üçün müştərinin olmasını təmin edir.
[Məlumat bütövlüyü qaydalarına uyğunluq. Mənbə sistemlərinin əlaqəli verilənlər bazalarında saxlanılan məlumatlar obyekt bütövlüyü və istinad bütövlüyü qaydalarına uyğun olmalıdır. Əsas açar kimi null-a icazə verən hər hansı bir cədvəl obyektin bütövlüyünə malik deyil. İstinad bütövlüyü valideynlər və uşaqlar arasında münasibətləri düzgün qurmağa məcbur edir. Müştəri-sifariş münasibətində istinad bütövlüyü verilənlər bazasındakı hər sifariş üçün müştərinin olmasını təmin edir.]
4. Məlumatların təmizlənməsinin keyfiyyəti
Məlumatların təmizlənməsinin keyfiyyəti bigdata-da olduqca problemli məsələdir. Tapşırığı yerinə yetirmək üçün məlumatların nə dərəcədə təmizlənməsinin lazım olduğu sualına cavab vermək hər bir məlumat analitiki üçün əsasdır. Əksər aktual problemlərdə bunu hər bir analitik özü müəyyənləşdirir və çətin ki, kənardan kimsə onun həllində bu cəhəti dəyərləndirə bilsin. Ancaq bu vəziyyətdə tapşırığı yerinə yetirmək üçün bu məsələ son dərəcə vacib idi, çünki hüquqi məlumatların etibarlılığı birinə meyl etməlidir.
Əməliyyat etibarlılığını müəyyən etmək üçün proqram test texnologiyalarını nəzərə almaq. Bu gün bu modellərdən daha çoxu var
Fig. 6
Aşağıdakı kimi düşünmək: "Əgər tapılan səhv bu modeldəki uğursuzluq hadisəsinə bənzər bir hadisədirsə, t parametrinin analoqunu necə tapmaq olar?" Və mən aşağıdakı modeli tərtib etdim: Təsəvvür edək ki, testerin bir qeydi yoxlamaq üçün çəkdiyi vaxt 1 dəqiqədir (sözügedən verilənlər bazası üçün), onda bütün səhvləri tapmaq üçün ona 365 dəqiqə lazımdır ki, bu da təxminən 494 il və 3 ildir. aylarla iş vaxtı. Anladığımız kimi, bu, çox böyük iş həcmidir və verilənlər bazasını yoxlamaq xərcləri bu verilənlər bazasını tərtib edən şəxs üçün çox böyük olacaqdır. Bu düşüncədə xərclərin iqtisadi konsepsiyası ortaya çıxır və təhlildən sonra bunun kifayət qədər təsirli bir vasitə olduğu qənaətinə gəldim. İqtisadiyyat qanununa əsaslanaraq: “Firmanın maksimum mənfəətinin əldə olunduğu istehsal həcmi (vahidlərlə) yeni məhsul vahidinin istehsalının marjinal xərclərinin bu firmanın ala biləcəyi qiymətlə müqayisə edildiyi nöqtədə yerləşir. yeni vahid üçün." Hər bir sonrakı səhvin tapılması qeydlərin getdikcə daha çox yoxlanılmasını tələb etdiyi postulatına əsaslanaraq, bu, xərc faktorudur. Yəni sınaq modellərində qəbul edilən postulat aşağıdakı nümunədə fiziki məna kəsb edir: i-ci xətanı tapmaq üçün n qeydi yoxlamaq lazım idisə, növbəti (i+3) xətanı tapmaq lazım gələcək. m qeydləri yoxlamaq və eyni zamanda n
- Yeni xəta aşkar edilməzdən əvvəl yoxlanılan qeydlərin sayı sabitləşdikdə;
- Növbəti səhv tapılmadan əvvəl yoxlanılan qeydlərin sayı artacaq.
Kritik dəyəri müəyyən etmək üçün mən iqtisadi məqsədəuyğunluq konsepsiyasına müraciət etdim, bu halda sosial xərclər anlayışından istifadə edərək, aşağıdakı kimi formalaşdırıla bilər: “Səhvinin düzəldilməsi xərclərini edə bilən iqtisadi agent ödəməlidir. ən aşağı qiymətə”. Bizim bir agentimiz var - bir rekordu yoxlamağa 1 dəqiqə sərf edən tester. Pul baxımından gündə 6000 rubl qazanırsınızsa, bu 12,2 rubl olacaq. (təxminən bu gün). İqtisadi hüquqda tarazlığın ikinci tərəfini müəyyən etmək qalır. Mən belə əsaslandırdım. Mövcud bir səhv, aidiyyəti şəxsdən, yəni əmlak sahibindən onu düzəltmək üçün səy sərf etməsini tələb edəcəkdir. Tutaq ki, bunun üçün 1 günlük fəaliyyət tələb olunur (ərizə təqdim edin, düzəliş edilmiş sənəd alın). O zaman sosial baxımdan onun xərcləri orta gündəlik əmək haqqına bərabər olacaq. Xantı-Mansi Muxtar Dairəsində orta hesablanmış əmək haqqı
3053,542: 12,2 = 250,4 qeyd vahidi.
Bu, sosial nöqteyi-nəzərdən o deməkdir ki, əgər sınaqçı 251 qeydi yoxlayıb və bir səhv tapıbsa, bu, istifadəçinin bu xətanı özü düzəltməsinə bərabərdir. Müvafiq olaraq, əgər sınaqçı növbəti səhvi tapmaq üçün 252 qeydin yoxlanılmasına bərabər vaxt sərf edibsə, onda bu halda korreksiyanın dəyərini istifadəçiyə keçirmək daha yaxşıdır.
Burada sadələşdirilmiş yanaşma təqdim olunur, çünki sosial baxımdan hər bir mütəxəssisin yaratdığı bütün əlavə dəyəri, yəni vergilər və sosial ödənişlər daxil olmaqla xərcləri nəzərə almaq lazımdır, lakin model aydındır. Bu əlaqənin nəticəsi mütəxəssislər üçün aşağıdakı tələbdir: İT sənayesi mütəxəssisinin maaşı ölkə üzrə orta səviyyədən yüksək olmalıdır. Əgər onun maaşı potensial verilənlər bazası istifadəçilərinin orta maaşından azdırsa, o zaman özü bütün verilənlər bazasını əlbəyaxa yoxlamalıdır.
Təsvir edilən meyardan istifadə edərkən verilənlər bazasının keyfiyyətinə ilk tələb formalaşır:
I(tr). Kritik səhvlərin payı 1/250,4 = 0,39938% -dən çox olmamalıdır. Bir az az
İqtisadi geri çəkilmə.
Əslində, qeydlərdə belə bir sıra səhvlərə yol verməklə, cəmiyyət aşağıdakı məbləğdə iqtisadi itkilərlə razılaşır:
1459*3053,542 = 4 rubl.
Bu məbləğ cəmiyyətin bu xərcləri azaltmaq üçün alətlərə malik olmaması ilə müəyyən edilir. Buradan belə çıxır ki, əgər kiminsə səhvləri olan qeydlərin sayını, məsələn, 259-a endirməyə imkan verən texnologiya varsa, bu, cəmiyyətə qənaət etməyə imkan verəcək:
1200*3053,542 = 3 rubl.
Ancaq eyni zamanda, istedadını və işini istəyə bilər, deyək ki, 1 milyon rubl.
Yəni, sosial xərclər aşağıdakılarla azalır:
3 - 664 = 250 rubl.
Əslində, bu təsir BigDat texnologiyalarının istifadəsindən əldə edilən əlavə dəyərdir.
Ancaq burada nəzərə almaq lazımdır ki, bu, sosial effektdir və məlumat bazasının sahibi bələdiyyə orqanlarıdır, onların bu məlumat bazasında qeyd olunan əmlakın istifadəsindən əldə etdiyi gəlir 0,3% nisbətində: 2,778 milyard rubl/ il. Və bu xərclər (4 rubl) onu çox narahat etmir, çünki onlar əmlak sahiblərinə verilir. Və bu aspektdə Bigdata-da daha çox təmizləyici texnologiyaların tərtibçisi bu verilənlər bazası sahibini inandırmaq bacarığını nümayiş etdirməli olacaq və belə şeylər kifayət qədər istedad tələb edir.
Bu misalda səhvlərin qiymətləndirilməsi alqoritmi etibarlılıq testi zamanı proqram təminatının yoxlanılmasının Schumann modeli [2] əsasında seçilmişdir. İnternetdə yayılmasına və lazımi statistik göstəriciləri əldə etmək imkanına görə. Metodologiya Monaxov Yu.M.-dən götürülmüşdür. “İnformasiya sistemlərinin funksional dayanıqlığı”, Şəkildəki spoylerin altına baxın. 7-9.
düyü. 7 – 9 Şuman modelinin metodologiyası
Bu materialın ikinci hissəsində Schumann modelindən istifadənin nəticələrinin alındığı məlumatların təmizlənməsi nümunəsi təqdim olunur.
Əldə olunan nəticələri təqdim edim:
Səhvlərin təxmini sayı N = 3167 n.
Parametr C, lambda və etibarlılıq funksiyası:
Şəkil 17
Əslində, lambda hər mərhələdə səhvlərin aşkar edildiyi intensivliyin faktiki göstəricisidir. İkinci hissəyə nəzər salsanız, bu göstərici üzrə təxmin saatda 42,4 səhv olub ki, bu da Schumann göstəricisi ilə kifayət qədər müqayisə oluna bilər. Yuxarıda müəyyən edilmişdir ki, tərtibatçının səhvləri tapma sürəti dəqiqədə 1 qeydi yoxlayarkən 250,4 qeyd üçün 1 xətadan aşağı olmamalıdır. Beləliklə, Schumann modeli üçün lambdanın kritik dəyəri:
60 / 250,4 = 0,239617.
Yəni, səhvləri tapmaq üçün prosedurları yerinə yetirmək ehtiyacı lambda mövcud 38,964-dən 0,239617-ə düşənə qədər həyata keçirilməlidir.
Və ya göstərici N (səhvlərin potensial sayı) minus n (səhvlərin düzəldilmiş sayı) qəbul edilmiş həddən aşağı düşənə qədər - 1459 ədəd.
Ədəbiyyat
- Monaxov, Yu.M. İnformasiya sistemlərinin funksional sabitliyi. 3 saat ərzində 1-ci hissə. Proqram təminatının etibarlılığı: dərslik. müavinət / Yu. M. Monaxov; Vladimir. dövlət univ. – Vladimir: İzvo Vladimir. dövlət Universitet, 2011. – 60 s. – ISBN 978-5-9984-0189-3.
- Martin L. Shooman, “Proqram təminatının etibarlılığının proqnozlaşdırılması üçün ehtimal modelləri”.
- İT mütəxəssisləri üçün məlumat anbarının əsasları / Paulraj Ponniah.—2-ci nəşr.
Mənbə: www.habr.com