Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri

1. İlkin məlumatlar

Məlumatların təmizlənməsi məlumatların təhlili tapşırıqlarının qarşısında duran problemlərdən biridir. Bu materialda kadastr dəyərinin formalaşmasında məlumat bazasının təhlilinin praktiki probleminin həlli nəticəsində yaranan inkişaflar və həllər öz əksini tapmışdır. Mənbələr burada “Xantı-Mansiysk Muxtar Dairəsi - Uqra ərazisində bütün növ daşınmaz əmlakın (torpaq sahələri istisna olmaqla) dövlət kadastr qiymətləndirilməsinin nəticələri haqqında № 01/OKS-2019 HESABAT”.

“Əlavə B. KS-nin müəyyən edilməsinin nəticələri 5. Kadastr dəyərinin müəyyən edilməsi metodu haqqında məlumat 5.1 Müqayisəli yanaşma”da “Müqayisəli model cəmi.ods” faylına baxılmışdır.

Cədvəl 1. “Müqayisəli model total.ods” faylında verilənlər toplusunun statistik göstəriciləri
Sahələrin ümumi sayı, ədəd. - 44
Qeydlərin ümumi sayı, ədəd. - 365 490
Simvolların ümumi sayı, ədəd. — 101 714 693
Yazıdakı simvolların orta sayı, ədəd. — 278,297
Rekorddakı simvolların standart sapması, ədəd. — 15,510
Girişdəki simvolların minimum sayı, ədəd. - 198
Girişdəki simvolların maksimum sayı, ədəd. - 363

2. Giriş hissəsi. Əsas standartlar

Göstərilən verilənlər bazası təhlil edilərkən, təmizlənmə dərəcəsinə olan tələbləri müəyyən etmək üçün tapşırıq formalaşdırıldı, çünki hər kəsə aydın olduğu kimi, göstərilən məlumat bazası istifadəçilər üçün hüquqi və iqtisadi nəticələr yaradır. İş zamanı məlum oldu ki, böyük verilənlərin təmizlənməsi dərəcəsi üçün heç bir xüsusi tələblər yoxdur. Bu məsələdə hüquq normalarını təhlil edərək belə qənaətə gəldim ki, onların hamısı imkanlardan formalaşıb. Yəni müəyyən bir tapşırıq ortaya çıxdı, tapşırıq üçün məlumat mənbələri tərtib edilir, sonra verilənlər toplusu formalaşır və yaradılmış verilənlər bazası əsasında problemin həlli üçün alətlər yaradılır. Nəticə həllər alternativlərdən seçim edərkən istinad nöqtələridir. Bunu Şəkil 1-də təqdim etdim.

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri

Hər hansı bir standartın müəyyənləşdirilməsi məsələlərində sübut edilmiş texnologiyalara etibar etmək daha məqsədəuyğun olduğu üçün mən bənddə göstərilən tələbləri seçdim. "MHRA GxP Məlumat Dürüstlüyünün Tərifləri və Sənaye üçün Rəhbərlik", çünki mən bu sənədi bu məsələ üçün ən əhatəli hesab etdim. Xüsusilə, bu sənəddə bölmə "Qeyd etmək lazımdır ki, məlumatların bütövlüyü tələbləri əl (kağız) və elektron məlumatlara eyni dərəcədə tətbiq olunur." (tərcümə: “...məlumatların bütövlüyü tələbləri əl (kağız) və elektron məlumatlara eyni dərəcədə tətbiq edilir”). Bu ifadə Mülki Prosessual Məcəllənin 71-ci maddəsinin müddəalarında "yazılı sübut" anlayışı ilə tamamilə bağlıdır. 70 CAS, Maddə 75 APC, “yazılı” Maddə. 84 Mülki Prosessual Məcəllə.

Şəkil 2-də hüquq elmində məlumat növlərinə yanaşmaların formalaşması diaqramı təqdim olunur.

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
düyü. 2. Mənbə burada.

Şəkil 3-də yuxarıdakı “Rəhbərliyin” tapşırıqları üçün Şəkil 1-in mexanizmi göstərilir. Müqayisə apararaq görmək asandır ki, informasiya sistemləri üçün müasir standartlarda informasiyanın bütövlüyünə dair tələblərə cavab verən zaman istifadə olunan yanaşmalar informasiyanın hüquqi anlayışı ilə müqayisədə xeyli məhduddur.

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
Şəkil 3

Göstərilən sənəddə (Rəhbərlik), texniki hissəyə qoşulma, məlumatların emalı və saxlanması imkanları 18.2-ci fəsildən bir sitatla yaxşı təsdiqlənir. Əlaqəli verilənlər bazası: "Bu fayl strukturu mahiyyət etibarilə daha təhlükəsizdir, çünki verilənlər verilənlər və metadata arasındakı əlaqəni qoruyan böyük fayl formatında saxlanılır."

Əslində, bu yanaşmada - mövcud texniki imkanlardan anormal heç nə yoxdur və özlüyündə bu, təbii prosesdir, çünki anlayışların genişlənməsi ən çox öyrənilən fəaliyyətdən - verilənlər bazası dizaynından irəli gəlir. Lakin, digər tərəfdən, mövcud sistemlərin texniki imkanlarına endirimləri nəzərdə tutmayan hüquqi normalar ortaya çıxır, məsələn: GDPR - Ümumi Məlumatların Qorunması Qaydası.

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
düyü. 4. Texniki imkanların hunisi (Mənbə).

Bu aspektlərdə aydın olur ki, ilkin verilənlər toplusu (şək. 1) ilk növbədə saxlanmalı, ikincisi isə ondan əlavə məlumatların çıxarılması üçün əsas olmalıdır. Yaxşı, bir nümunə olaraq: yol hərəkəti qaydalarını qeyd edən kameralar hər yerdə mövcuddur, məlumat emal sistemləri pozucuları aradan qaldırır, lakin digər məlumatlar da digər istehlakçılara təklif edilə bilər, məsələn, bir ticarət mərkəzinə müştərilərin axınının strukturunun marketinq monitorinqi kimi. Və bu, BigDat istifadə edərkən əlavə əlavə dəyər mənbəyidir. Çox güman ki, indi, hardasa gələcəkdə toplanan məlumat dəstləri indiki vaxtda 1700-cü il nadir nəşrlərin dəyərinə bənzər mexanizmə görə dəyərə malik olacaq. Axı, əslində, müvəqqəti məlumat dəstləri unikaldır və gələcəkdə təkrarlanma ehtimalı azdır.

3. Giriş hissəsi. Qiymətləndirmə meyarı

Emal prosesi zamanı səhvlərin aşağıdakı təsnifatı hazırlanmışdır.

1. Səhv sinfi (GOST R 8.736-2011 əsasında): a) sistematik xətalar; b) təsadüfi səhvlər; c) kobud səhv.

2. Çoxluğa görə: a) mono təhrif; b) çox təhrif.

3. Nəticələrin kritikliyinə görə: a) kritik; b) kritik deyil.

4. Baş vermə mənbəyinə görə:

A) Texniki – avadanlığın istismarı zamanı baş verən xətalar. IoT sistemləri, rabitə keyfiyyətinə əhəmiyyətli dərəcədə təsir göstərən sistemlər, avadanlıq (aparat) üçün kifayət qədər uyğun bir səhv.

B) Operator xətaları - məlumatların daxil edilməsi zamanı operatorun hərf səhvlərindən tutmuş verilənlər bazasının dizaynı üçün texniki şərtlərdəki səhvlərə qədər geniş diapazonda olan xətalar.

C) İstifadəçi xətaları - burada bütün diapazondakı istifadəçi xətaları "düzmanı dəyişməyi unutdum"dan tutmuş sayğacların ayaqla səhv salınmasına qədərdir.

5. Ayrı bir sinifə ayrılır:

a) "separatorun tapşırığı", yəni boşluq və ":" (bizim vəziyyətimizdə) təkrarlandığı zaman;
b) birlikdə yazılmış sözlər;
c) xidmət simvollarından sonra boşluq yoxdur
d) simmetrik çoxlu simvollar: (), "", "...".

Şəkil 5-də təqdim olunan verilənlər bazası xətalarının sistemləşdirilməsi ilə birlikdə, səhvlərin axtarışı və bu nümunə üçün məlumatların təmizlənməsi alqoritminin hazırlanması üçün kifayət qədər effektiv koordinat sistemi formalaşır.

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
düyü. 5. Verilənlər bazasının struktur bölmələrinə uyğun gələn tipik səhvlər (Mənbə: Oreşkov V.İ., Paklin N.B. "Məlumatların konsolidasiyası üçün əsas anlayışlar").

Dəqiqlik, Domain bütövlüyü, Məlumat növü, ardıcıllıq, artıqlıq, tamlıq, təkrarlama, biznes qaydalarına uyğunluq, struktur dəqiqliyi, məlumat anomaliyaları, aydınlıq, vaxtında, məlumatların bütövlüyü qaydalarına riayət etmək. (Səhifə 334. İT mütəxəssisləri üçün məlumat anbarının əsasları / Paulraj Ponniah.—2-ci nəşr.)

Mötərizədə ingilis dili və rusca maşın tərcüməsi təqdim olunur.

Dəqiqlik. Məlumat elementi üçün sistemdə saxlanılan dəyər verilənlər elementinin həmin baş verməsi üçün düzgün dəyərdir. Müştəri adınız və qeyddə saxlanmış ünvanınız varsa, o zaman ünvan həmin ada malik müştəri üçün düzgün ünvandır. Əgər 1000 nömrəli sifariş üçün qeyddə sifariş edilmiş miqdarı 12345678 vahid olaraq tapsanız, o zaman həmin miqdar həmin sifariş üçün dəqiq miqdardır.
[Dəqiqlik. Məlumat elementi üçün sistemdə saxlanılan dəyər verilənlər elementinin həmin baş verməsi üçün düzgün dəyərdir. Əgər qeyddə saxlanılan müştəri adınız və ünvanınız varsa, o zaman ünvan həmin ada malik müştəri üçün düzgün ünvandır. Əgər 1000 nömrəli sifariş üçün qeyddə sifariş edilmiş miqdarı 12345678 vahid olaraq tapsanız, o zaman həmin miqdar həmin sifariş üçün dəqiq miqdardır.]

Domain bütövlüyü. Bir atributun məlumat dəyəri icazə verilən, müəyyən edilmiş dəyərlər aralığına düşür. Ümumi nümunə, gender məlumat elementi üçün icazə verilən dəyərlər "kişi" və "qadın"dır.
[Domen bütövlüyü. Atribut məlumat dəyəri etibarlı, müəyyən edilmiş dəyərlər diapazonuna düşür. Ümumi nümunə gender məlumat elementi üçün etibarlı "kişi" və "qadın" dəyərləridir.]

Məlumat növü. Məlumat atributunun dəyəri əslində həmin atribut üçün müəyyən edilmiş məlumat növü kimi saxlanılır. Mağaza adı sahəsinin məlumat növü “mətn” kimi müəyyən edildikdə, həmin sahənin bütün nümunələri rəqəmsal kodlardan deyil, mətn formatında göstərilən mağaza adını ehtiva edir.
[Məlumat növü. Məlumat atributunun dəyəri əslində həmin atribut üçün müəyyən edilmiş məlumat növü kimi saxlanılır. Əgər mağaza adı sahəsinin məlumat növü "mətn" kimi müəyyən edilirsə, bu sahənin bütün nümunələri rəqəmsal kodlardan daha çox mətn formatında göstərilən mağaza adını ehtiva edir.]

Ardıcıllıq. Məlumat sahəsinin forması və məzmunu bir çox mənbə sistemlərində eynidir. Bir sistemdə ABC məhsulunun məhsul kodu 1234-dürsə, bu məhsulun kodu hər bir mənbə sistemində 1234-dür.
[Ardıcıllıq. Məlumat sahəsinin forması və məzmunu müxtəlif mənbə sistemlərində eynidir. Əgər bir sistemdə ABC məhsulunun məhsul kodu 1234-dürsə, o zaman həmin məhsulun kodu hər bir mənbə sistemində 1234-dür.]

Artıqlıq. Eyni məlumatlar sistemdə birdən çox yerdə saxlanılmamalıdır. Əgər səmərəlilik səbəbi ilə məlumat elementi qəsdən sistemdə birdən çox yerdə saxlanılırsa, artıqlıq aydın şəkildə müəyyən edilməli və yoxlanılmalıdır.
[İstehsalat. Eyni məlumatlar sistemdə birdən çox yerdə saxlanılmamalıdır. Əgər səmərəlilik səbəbi ilə məlumat elementi qəsdən sistemdə bir neçə yerdə saxlanılırsa, artıqlıq aydın şəkildə müəyyən edilməli və yoxlanılmalıdır.]

Tamlıq. Sistemdə verilmiş atribut üçün əskik dəyər yoxdur. Məsələn, müştəri faylında hər bir müştəri üçün “status” sahəsi üçün etibarlı dəyər olmalıdır. Sifariş təfərrüatları faylında sifariş üçün hər bir detal qeydi tam doldurulmalıdır.
[Tamlıq. Bu atribut üçün sistemdə əskik dəyər yoxdur. Məsələn, müştəri faylı hər bir müştəri üçün "status" sahəsi üçün etibarlı dəyərə malik olmalıdır. Sifariş təfərrüatları faylında hər bir sifariş təfərrüatının qeydi tamamilə doldurulmalıdır.]

Dublikasiya. Sistemdə qeydlərin təkrarlanması tamamilə həll edilir. Əgər məhsul faylında dublikat qeydlər olduğu məlumdursa, onda hər bir məhsul üçün bütün dublikat qeydlər müəyyən edilir və çarpaz arayış yaradılır.
[Dublikat. Sistemdə qeydlərin təkrarlanması tamamilə aradan qaldırılıb. Əgər məhsul faylında dublikat qeydlər olduğu bilinirsə, onda hər bir məhsul üçün bütün dublikat qeydlər müəyyən edilir və çarpaz istinad yaradılır.]

Biznes Qaydalarına Uyğunluq. Hər bir məlumat elementinin dəyərləri müəyyən edilmiş iş qaydalarına uyğundur. Hərrac sistemində çəkic və ya satış qiyməti ehtiyat qiymətdən aşağı ola bilməz. Bank kredit sistemində kredit qalığı həmişə müsbət və ya sıfır olmalıdır.
[İş qaydalarına uyğunluq. Hər bir məlumat elementinin dəyərləri müəyyən edilmiş iş qaydalarına uyğundur. Hərrac sistemində çəkic və ya satış qiyməti ehtiyat qiymətdən aşağı ola bilməz. Bank kredit sistemində kredit balansı həmişə müsbət və ya sıfır olmalıdır.]

Struktur Müəyyənlik. Məlumat elementinin təbii olaraq fərdi komponentlərə strukturlaşdırıla bildiyi yerdə, element bu yaxşı müəyyən edilmiş strukturu ehtiva etməlidir. Məsələn, bir şəxsin adı təbii olaraq ad, ata və soyad olaraq bölünür. Fiziki şəxslərin adları üçün dəyərlər ad, ata adı və soyad kimi saxlanmalıdır. Məlumat keyfiyyətinin bu xüsusiyyəti standartların tətbiqini asanlaşdırır və çatışmayan dəyərləri azaldır.
[Struktur Müəyyənlik. Məlumat elementi təbii olaraq fərdi komponentlərə strukturlaşdırıla bildiyi halda, element bu yaxşı müəyyən edilmiş strukturu ehtiva etməlidir. Məsələn, insanın adı təbii olaraq ad, atasının başlanğıcı və soyadına bölünür. Fərdi adlar üçün dəyərlər ad, ata adı və soyad kimi saxlanmalıdır. Bu məlumat keyfiyyəti xarakteristikası standartların tətbiqini asanlaşdırır və çatışmayan dəyərləri azaldır.]

Məlumat anomaliyası. Sahə yalnız müəyyən edildiyi məqsəd üçün istifadə edilməlidir. Əgər Ünvan-3 sahəsi uzun ünvanlar üçün hər hansı mümkün üçüncü ünvan sətri üçün müəyyən edilibsə, onda bu sahə yalnız üçüncü ünvan sətirinin qeydi üçün istifadə edilməlidir. Müştəri üçün telefon və ya faks nömrəsini daxil etmək üçün istifadə edilməməlidir.
[Məlumat anomaliyası. Sahə yalnız müəyyən edildiyi məqsəd üçün istifadə edilməlidir. Əgər Ünvan-3 sahəsi uzun ünvanlar üçün hər hansı mümkün üçüncü ünvan sətri üçün müəyyən edilmişdirsə, onda bu sahə yalnız üçüncü ünvan xəttini qeyd etmək üçün istifadə edilməlidir. Müştəri üçün telefon və ya faks nömrəsini daxil etmək üçün istifadə edilməməlidir.]

Aydınlıq. Məlumat elementi keyfiyyətli məlumatın bütün digər xüsusiyyətlərinə malik ola bilər, lakin istifadəçilər onun mənasını aydın başa düşmürlərsə, məlumat elementinin istifadəçilər üçün heç bir dəyəri yoxdur. Düzgün adlandırma konvensiyaları məlumat elementlərinin istifadəçilər tərəfindən yaxşı başa düşülməsinə kömək edir.
[Aydınlıq. Məlumat elementi yaxşı verilənlərin bütün digər xüsusiyyətlərinə malik ola bilər, lakin istifadəçilər onun mənasını aydın başa düşmürlərsə, məlumat elementinin istifadəçilər üçün heç bir dəyəri yoxdur. Düzgün adlandırma konvensiyaları məlumat elementlərinin istifadəçilər tərəfindən yaxşı başa düşülməsinə kömək edir.]

Vaxtında. İstifadəçilər məlumatların vaxtında olmasını müəyyənləşdirirlər. Əgər istifadəçilər müştəri ölçüsü məlumatlarının bir gündən köhnə olmamasını gözləyirlərsə, mənbə sistemlərində müştəri məlumatlarına edilən dəyişikliklər hər gün məlumat anbarına tətbiq edilməlidir.
[Vaxtında. İstifadəçilər məlumatların vaxtında olmasını müəyyənləşdirirlər. İstifadəçilər müştəri ölçüsü məlumatlarının bir gündən çox olmamasını gözləyirlərsə, mənbə sistemlərindəki müştəri məlumatlarına edilən dəyişikliklər gündəlik olaraq məlumat anbarına tətbiq edilməlidir.]

Faydalılıq. Məlumat anbarındakı hər bir məlumat elementi istifadəçilərin toplanmasının bəzi tələblərinə cavab verməlidir. Məlumat elementi dəqiq və yüksək keyfiyyətli ola bilər, lakin istifadəçilər üçün heç bir dəyəri yoxdursa, o zaman həmin məlumat elementinin məlumat anbarında olması tamamilə lazımsızdır.
[Utility. Məlumat anbarındakı hər bir məlumat elementi istifadəçi kolleksiyasının bəzi tələblərinə cavab verməlidir. Məlumat elementi dəqiq və yüksək keyfiyyətli ola bilər, lakin o, istifadəçilərə dəyər vermirsə, o zaman həmin məlumat elementinin məlumat anbarında olması vacib deyil.]

Məlumatların bütövlüyü qaydalarına riayət edilməsi. Mənbə sistemlərinin əlaqəli verilənlər bazalarında saxlanılan məlumatlar obyekt bütövlüyü və istinad bütövlüyü qaydalarına uyğun olmalıdır. Əsas açar kimi null-a icazə verən hər hansı bir cədvəl obyektin bütövlüyünə malik deyil. Referensial dürüstlük valideyn-övlad münasibətlərini düzgün qurmağa məcbur edir. Müştəri-sifariş münasibətində istinad bütövlüyü verilənlər bazasında hər sifariş üçün müştərinin olmasını təmin edir.
[Məlumat bütövlüyü qaydalarına uyğunluq. Mənbə sistemlərinin əlaqəli verilənlər bazalarında saxlanılan məlumatlar obyekt bütövlüyü və istinad bütövlüyü qaydalarına uyğun olmalıdır. Əsas açar kimi null-a icazə verən hər hansı bir cədvəl obyektin bütövlüyünə malik deyil. İstinad bütövlüyü valideynlər və uşaqlar arasında münasibətləri düzgün qurmağa məcbur edir. Müştəri-sifariş münasibətində istinad bütövlüyü verilənlər bazasındakı hər sifariş üçün müştərinin olmasını təmin edir.]

4. Məlumatların təmizlənməsinin keyfiyyəti

Məlumatların təmizlənməsinin keyfiyyəti bigdata-da olduqca problemli məsələdir. Tapşırığı yerinə yetirmək üçün məlumatların nə dərəcədə təmizlənməsinin lazım olduğu sualına cavab vermək hər bir məlumat analitiki üçün əsasdır. Əksər aktual problemlərdə bunu hər bir analitik özü müəyyənləşdirir və çətin ki, kənardan kimsə onun həllində bu cəhəti dəyərləndirə bilsin. Ancaq bu vəziyyətdə tapşırığı yerinə yetirmək üçün bu məsələ son dərəcə vacib idi, çünki hüquqi məlumatların etibarlılığı birinə meyl etməlidir.

Əməliyyat etibarlılığını müəyyən etmək üçün proqram test texnologiyalarını nəzərə almaq. Bu gün bu modellərdən daha çoxu var 200. Bir çox model iddia xidmət modelindən istifadə edir:

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
Fig. 6

Aşağıdakı kimi düşünmək: "Əgər tapılan səhv bu modeldəki uğursuzluq hadisəsinə bənzər bir hadisədirsə, t parametrinin analoqunu necə tapmaq olar?" Və mən aşağıdakı modeli tərtib etdim: Təsəvvür edək ki, testerin bir qeydi yoxlamaq üçün çəkdiyi vaxt 1 dəqiqədir (sözügedən verilənlər bazası üçün), onda bütün səhvləri tapmaq üçün ona 365 dəqiqə lazımdır ki, bu da təxminən 494 il və 3 ildir. aylarla iş vaxtı. Anladığımız kimi, bu, çox böyük iş həcmidir və verilənlər bazasını yoxlamaq xərcləri bu verilənlər bazasını tərtib edən şəxs üçün çox böyük olacaqdır. Bu düşüncədə xərclərin iqtisadi konsepsiyası ortaya çıxır və təhlildən sonra bunun kifayət qədər təsirli bir vasitə olduğu qənaətinə gəldim. İqtisadiyyat qanununa əsaslanaraq: “Firmanın maksimum mənfəətinin əldə olunduğu istehsal həcmi (vahidlərlə) yeni məhsul vahidinin istehsalının marjinal xərclərinin bu firmanın ala biləcəyi qiymətlə müqayisə edildiyi nöqtədə yerləşir. yeni vahid üçün." Hər bir sonrakı səhvin tapılması qeydlərin getdikcə daha çox yoxlanılmasını tələb etdiyi postulatına əsaslanaraq, bu, xərc faktorudur. Yəni sınaq modellərində qəbul edilən postulat aşağıdakı nümunədə fiziki məna kəsb edir: i-ci xətanı tapmaq üçün n qeydi yoxlamaq lazım idisə, növbəti (i+3) xətanı tapmaq lazım gələcək. m qeydləri yoxlamaq və eyni zamanda n

  1. Yeni xəta aşkar edilməzdən əvvəl yoxlanılan qeydlərin sayı sabitləşdikdə;
  2. Növbəti səhv tapılmadan əvvəl yoxlanılan qeydlərin sayı artacaq.

Kritik dəyəri müəyyən etmək üçün mən iqtisadi məqsədəuyğunluq konsepsiyasına müraciət etdim, bu halda sosial xərclər anlayışından istifadə edərək, aşağıdakı kimi formalaşdırıla bilər: “Səhvinin düzəldilməsi xərclərini edə bilən iqtisadi agent ödəməlidir. ən aşağı qiymətə”. Bizim bir agentimiz var - bir rekordu yoxlamağa 1 dəqiqə sərf edən tester. Pul baxımından gündə 6000 rubl qazanırsınızsa, bu 12,2 rubl olacaq. (təxminən bu gün). İqtisadi hüquqda tarazlığın ikinci tərəfini müəyyən etmək qalır. Mən belə əsaslandırdım. Mövcud bir səhv, aidiyyəti şəxsdən, yəni əmlak sahibindən onu düzəltmək üçün səy sərf etməsini tələb edəcəkdir. Tutaq ki, bunun üçün 1 günlük fəaliyyət tələb olunur (ərizə təqdim edin, düzəliş edilmiş sənəd alın). O zaman sosial baxımdan onun xərcləri orta gündəlik əmək haqqına bərabər olacaq. Xantı-Mansi Muxtar Dairəsində orta hesablanmış əmək haqqı “2019-cu ilin yanvar-sentyabr ayları üçün Xantı-Mansiysk Muxtar Dairəsi - Uqranın sosial-iqtisadi inkişafının yekunları” 73285 rub. və ya 3053,542 rubl / gün. Müvafiq olaraq, aşağıdakılara bərabər kritik bir dəyər əldə edirik:
3053,542: 12,2 = 250,4 qeyd vahidi.

Bu, sosial nöqteyi-nəzərdən o deməkdir ki, əgər sınaqçı 251 qeydi yoxlayıb və bir səhv tapıbsa, bu, istifadəçinin bu xətanı özü düzəltməsinə bərabərdir. Müvafiq olaraq, əgər sınaqçı növbəti səhvi tapmaq üçün 252 qeydin yoxlanılmasına bərabər vaxt sərf edibsə, onda bu halda korreksiyanın dəyərini istifadəçiyə keçirmək daha yaxşıdır.

Burada sadələşdirilmiş yanaşma təqdim olunur, çünki sosial baxımdan hər bir mütəxəssisin yaratdığı bütün əlavə dəyəri, yəni vergilər və sosial ödənişlər daxil olmaqla xərcləri nəzərə almaq lazımdır, lakin model aydındır. Bu əlaqənin nəticəsi mütəxəssislər üçün aşağıdakı tələbdir: İT sənayesi mütəxəssisinin maaşı ölkə üzrə orta səviyyədən yüksək olmalıdır. Əgər onun maaşı potensial verilənlər bazası istifadəçilərinin orta maaşından azdırsa, o zaman özü bütün verilənlər bazasını əlbəyaxa yoxlamalıdır.

Təsvir edilən meyardan istifadə edərkən verilənlər bazasının keyfiyyətinə ilk tələb formalaşır:
I(tr). Kritik səhvlərin payı 1/250,4 = 0,39938% -dən çox olmamalıdır. Bir az az saflaşdırma sənayedə qızıl. Fiziki baxımdan səhvləri olan 1459-dan çox qeyd yoxdur.

İqtisadi geri çəkilmə.

Əslində, qeydlərdə belə bir sıra səhvlərə yol verməklə, cəmiyyət aşağıdakı məbləğdə iqtisadi itkilərlə razılaşır:

1459*3053,542 = 4 rubl.

Bu məbləğ cəmiyyətin bu xərcləri azaltmaq üçün alətlərə malik olmaması ilə müəyyən edilir. Buradan belə çıxır ki, əgər kiminsə səhvləri olan qeydlərin sayını, məsələn, 259-a endirməyə imkan verən texnologiya varsa, bu, cəmiyyətə qənaət etməyə imkan verəcək:
1200*3053,542 = 3 rubl.

Ancaq eyni zamanda, istedadını və işini istəyə bilər, deyək ki, 1 milyon rubl.
Yəni, sosial xərclər aşağıdakılarla azalır:

3 - 664 = 250 rubl.

Əslində, bu təsir BigDat texnologiyalarının istifadəsindən əldə edilən əlavə dəyərdir.

Ancaq burada nəzərə almaq lazımdır ki, bu, sosial effektdir və məlumat bazasının sahibi bələdiyyə orqanlarıdır, onların bu məlumat bazasında qeyd olunan əmlakın istifadəsindən əldə etdiyi gəlir 0,3% nisbətində: 2,778 milyard rubl/ il. Və bu xərclər (4 rubl) onu çox narahat etmir, çünki onlar əmlak sahiblərinə verilir. Və bu aspektdə Bigdata-da daha çox təmizləyici texnologiyaların tərtibçisi bu verilənlər bazası sahibini inandırmaq bacarığını nümayiş etdirməli olacaq və belə şeylər kifayət qədər istedad tələb edir.

Bu misalda səhvlərin qiymətləndirilməsi alqoritmi etibarlılıq testi zamanı proqram təminatının yoxlanılmasının Schumann modeli [2] əsasında seçilmişdir. İnternetdə yayılmasına və lazımi statistik göstəriciləri əldə etmək imkanına görə. Metodologiya Monaxov Yu.M.-dən götürülmüşdür. “İnformasiya sistemlərinin funksional dayanıqlığı”, Şəkildəki spoylerin altına baxın. 7-9.

düyü. 7 – 9 Şuman modelinin metodologiyasıRock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri

Bu materialın ikinci hissəsində Schumann modelindən istifadənin nəticələrinin alındığı məlumatların təmizlənməsi nümunəsi təqdim olunur.
Əldə olunan nəticələri təqdim edim:
Səhvlərin təxmini sayı N = 3167 n.
Parametr C, lambda və etibarlılıq funksiyası:

Rock, Paper, Scissors oyunu kimi məlumatları təmizləyin. Bu, sonu olan və ya olmayan bir oyundur? Hissə 1. Nəzəri
Şəkil 17

Əslində, lambda hər mərhələdə səhvlərin aşkar edildiyi intensivliyin faktiki göstəricisidir. İkinci hissəyə nəzər salsanız, bu göstərici üzrə təxmin saatda 42,4 səhv olub ki, bu da Schumann göstəricisi ilə kifayət qədər müqayisə oluna bilər. Yuxarıda müəyyən edilmişdir ki, tərtibatçının səhvləri tapma sürəti dəqiqədə 1 qeydi yoxlayarkən 250,4 qeyd üçün 1 xətadan aşağı olmamalıdır. Beləliklə, Schumann modeli üçün lambdanın kritik dəyəri:

60 / 250,4 = 0,239617.

Yəni, səhvləri tapmaq üçün prosedurları yerinə yetirmək ehtiyacı lambda mövcud 38,964-dən 0,239617-ə düşənə qədər həyata keçirilməlidir.

Və ya göstərici N (səhvlərin potensial sayı) minus n (səhvlərin düzəldilmiş sayı) qəbul edilmiş həddən aşağı düşənə qədər - 1459 ədəd.

Ədəbiyyat

  1. Monaxov, Yu.M. İnformasiya sistemlərinin funksional sabitliyi. 3 saat ərzində 1-ci hissə. Proqram təminatının etibarlılığı: dərslik. müavinət / Yu. M. Monaxov; Vladimir. dövlət univ. – Vladimir: İzvo Vladimir. dövlət Universitet, 2011. – 60 s. – ISBN 978-5-9984-0189-3.
  2. Martin L. Shooman, “Proqram təminatının etibarlılığının proqnozlaşdırılması üçün ehtimal modelləri”.
  3. İT mütəxəssisləri üçün məlumat anbarının əsasları / Paulraj Ponniah.—2-ci nəşr.

İkinci hissə. nəzəri

Mənbə: www.habr.com

Добавить комментарий