Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык

1. Баштапкы маалыматтар

Маалыматтарды тазалоо маалыматтарды талдоо милдеттеринин алдында турган көйгөйлөрдүн бири болуп саналат. Бул материалда кадастрдык наркты түзүүдө маалымат базасын талдоо боюнча практикалык маселени чечүүнүн натыйжасында пайда болгон өнүгүүлөр жана чечимдер чагылдырылган. Булактар ​​бул жерде «Ханты-Мансийск автономиялык округунун - Угра аймагындагы кыймылсыз мүлктүн бардык түрлөрүнө (жер участокторунан тышкары) мамлекеттик кадастрдык баа берүүнүн жыйынтыктары жөнүндө № 01/ОКС-2019 ОТЧЕТ».

"Салыштырма модели total.ods" файлы "Тиркеме Б. КС 5. аныктоонун натыйжалары. Кадастрдык наркты аныктоо ыкмасы жөнүндө маалымат 5.1 Салыштырмалуу мамиле" каралды.

Таблица 1. “Салыштырма моделдин total.ods” файлындагы маалымат топтомунун статистикалык көрсөткүчтөрү
Талаалардын жалпы саны, даана. — 44
Жазуулардын жалпы саны, даана. — 365 490
Белгилердин жалпы саны, даана. — 101 714 693
Жазуудагы белгилердин орточо саны, даана. — 278,297 XNUMX
Жазуудагы символдордун стандарттык четтөөсү, даана. — 15,510 XNUMX
Жазуудагы белгилердин минималдуу саны, даана. — 198
Жазуудагы символдордун максималдуу саны, даана. — 363

2. киришүү бөлүгү. Негизги стандарттар

Көрсөтүлгөн маалымат базасын талдоодо тазалоонун даражасына карата талаптарды тактоо боюнча тапшырма түзүлдү, анткени бардыгына түшүнүктүү болгондой, көрсөтүлгөн маалымат базасы колдонуучулар үчүн укуктук жана экономикалык кесепеттерди жаратат. Иштин жүрүшүндө чоң маалыматтарды тазалоо даражасына конкреттүү талаптар жок экени белгилүү болду. Бул маселеде укуктук нормаларды талдап, мен алардын баары мүмкүнчүлүктөрдөн түзүлгөн деген тыянакка келдим. Башкача айтканда, белгилүү бир тапшырма пайда болду, тапшырма үчүн маалымат булактары түзүлөт, андан кийин маалымат топтому түзүлөт жана түзүлгөн маалымат топтомунун негизинде маселени чечүү үчүн куралдар. Натыйжадагы чечимдер альтернативалардан тандоодо таяныч пункттары болуп саналат. Мен муну 1-сүрөттө келтирдим.

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык

Кандайдыр бир стандарттарды аныктоодо далилденген технологияларга таянуу артык болгондуктан, мен "MHRA GxP маалыматтарынын бүтүндүгү аныктамалары жана өнөр жай үчүн жетекчилик", анткени мен бул документти бул маселе боюнча эң кеңири деп эсептедим. Атап айтканда, бул документтин бөлүмүндө "Маалыматтардын бүтүндүгү талаптары кол (кагаз) жана электрондук маалыматтарга бирдей колдонуларын белгилей кетүү керек." (котормосу: “...маалыматтардын бүтүндүгү талаптары кол (кагаз) жана электрондук маалыматтарга бирдей колдонулат”). Бул формулировка “жазуу жүзүндөгү далилдер” түшүнүгү менен өзгөчө байланыштуу, ал Жарандык процесстик кодекстин 71-беренесинин 70-ст. 75 CAS, АПК 84-ст., “жазуу жүзүндө” ст. XNUMX Жарандык процессуалдык кодекс.

2-сүрөттө юриспруденциядагы маалыматтын түрлөрүнө карата мамиленин калыптаныш диаграммасы берилген.

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
Күрүч. 2. Булак бул жерде.

3-сүрөттө жогорудагы “Жетекчиликтин” тапшырмалары үчүн 1-сүрөттүн механизми көрсөтүлгөн. Салыштыруу аркылуу маалымат тутумунун заманбап стандарттарында маалыматтын бүтүндүгү боюнча талаптарды канааттандырууда колдонулган ыкмалар маалыматтын укуктук концепциясына салыштырмалуу олуттуу чектелгендигин көрүү оңой.

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
3-сүрөт

Көрсөтүлгөн документте (Колдонмодо) техникалык бөлүккө кошулуу, маалыматтарды иштеп чыгуу жана сактоо мүмкүнчүлүктөрү 18.2-главадагы цитата менен жакшы тастыкталган. Реляциялык маалымат базасы: "Бул файл структурасы табиятынан кыйла коопсуз, анткени маалыматтар маалыматтар менен метаберилиштердин ортосундагы байланышты сактаган чоң файл форматында сакталат."

Чындыгында, бул ыкмада - бар болгон техникалык мүмкүнчүлүктөрдөн, анормалдуу эч нерсе жок жана өз алдынча бул табигый процесс, анткени түшүнүктөрдүн кеңейиши эң көп изилденген иш - маалымат базасын долбоорлоодон келип чыгат. Бирок, экинчи жагынан, мыйзам ченемдери иштеп жаткан системалардын техникалык мүмкүнчүлүктөрүнө арзандатууну караштырбаган пайда болот, мисалы: GDPR - Маалыматтарды коргоо боюнча жалпы жобо.

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
Күрүч. 4. Техникалык мүмкүнчүлүктөрдүн воронкасы (булак).

Бул аспектилерде баштапкы маалымат топтому (1-сүрөт) биринчиден, сакталышы керек, экинчиден, андан кошумча маалымат алуу үчүн негиз болоору белгилүү болот. Мисал катары: жол кыймылынын эрежелерин жаздыруучу камералар бардык жерде бар, маалыматты иштетүү системалары тартип бузгандарды жок кылат, бирок башка керектөөчүлөргө дагы башка маалымат сунушталышы мүмкүн, мисалы, соода борборуна кардарлардын агымынын структурасына маркетингдик мониторинг. Жана бул BigDat колдонууда кошумча кошумча нарктын булагы. Азыр чогултулуп жаткан маалымат топтомдору келечекте 1700 сейрек кездешүүчү басылмалардын азыркы учурдагы наркына окшош механизм боюнча баалуулукка ээ болушу толук мүмкүн. Анткени, чындыгында, убактылуу маалымат топтомдору уникалдуу жана келечекте кайталанышы күмөн.

3. Киришүү бөлүгү. Баалоо критерийлери

Кайра иштетүү процессинде каталардын төмөнкү классификациясы иштелип чыккан.

1. Ката классы (ГОСТ Р 8.736-2011 негизинде): а) системалуу каталар; б) кокус каталар; в) ката.

2. Көптүгү боюнча: а) моно бурмалоо; б) көп бурмалоо.

3. Критикалык кесепеттери боюнча: а) критикалык; б) сын эмес.

4. Пайда болгон булагы боюнча:

А) Техникалык – жабдууларды иштетүүдө пайда болгон каталар. IoT тутумдары, байланыштын, жабдуулардын (аппараттык камсыздоонун) сапатына олуттуу таасирин тийгизген системалар үчүн кыйла актуалдуу ката.

B) Оператордун каталары – киргизүү учурундагы оператордун каталарынан маалымат базасын долбоорлоодо техникалык мүнөздөмөлөрдөгү каталарга чейин кеңири диапазондогу каталар.

C) Колдонуучунун каталары - бул жерде "макетти которууну унутуп калгандан" баштап метрлерди бутка жаңылыштырууга чейинки бардык диапазондогу колдонуучу каталары.

5. Өзүнчө класска бөлүнгөн:

а) "бөлүүчүнүн милдети", башкача айтканда, боштук жана ":" (биздин учурда) ал кайталанганда;
б) бирге жазылган сөздөр;
в) кызматтык белгилерден кийин бош орун жок
г) симметриялуу бир нече символдор: (), "", "...".

5-сүрөттө берилген маалыматтар базасынын каталарын системалаштыруу менен бирге каталарды издөө жана бул мисал үчүн маалыматтарды тазалоо алгоритмин иштеп чыгуу үчүн жетиштүү эффективдүү координаттар системасы түзүлөт.

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
Райс. 5. Маалыматтар базасынын түзүмдүк бөлүмдөрүнө туура келген типтүү каталар (Булак: Орешков В.И., Паклин Н.Б. "Маалыматтарды консолидациялоонун негизги түшүнүктөрү").

Тактык, домендин бүтүндүгү, берилиштердин түрү, ырааттуулук, ашыкчалык, толуктук, кайталоо, бизнес эрежелерине шайкештик, структуралык тактык, маалымат аномалиясы, ачыктык, өз убагында, маалыматтардын бүтүндүгү эрежелерин сактоо. (334-бет. IT адистери үчүн маалымат кампасынын негиздери / Полраж Понниах.—2-бас.)

Англисче формулировка жана орусча машина котормосу кашаа ичинде берилген.

Тактык. Маалымат элементи үчүн тутумда сакталган маани маалымат элементинин ошол кездешүүсү үчүн туура маани болуп саналат. Эгерде сизде кардардын аты жана дареги жазууда сакталган болсо, анда дарек ошол аталыштагы кардар үчүн туура дарек болуп саналат. Эгерде сиз 1000 номерлүү заказдын жазуусунда 12345678 бирдик катары буйрутма берилген санды тапсаңыз, анда ал сан ошол заказ үчүн так сан болуп саналат.
[Тактык. Маалымат элементи үчүн тутумда сакталган маани маалымат элементинин ошол кездешүүсү үчүн туура маани болуп саналат. Эгерде сизде кардардын аты жана дареги жазууда сакталган болсо, анда дарек ошол аталыштагы кардар үчүн туура дарек болуп саналат. Эгерде сиз 1000 номерлүү заказдын жазуусунда 12345678 бирдик катары буйрутмаланган санды тапсаңыз, анда ал сан ошол заказдын так саны болуп саналат.]

Домендин бүтүндүгү. Атрибуттун маалымат мааниси уруксат берилген, аныкталган маанилердин диапазонуна түшөт. Жалпы мисал гендердик маалымат элементи үчүн "эркек" жана "аял" жол берилген баалуулуктар болуп саналат.
[Домендин бүтүндүгү. Атрибут маалыматынын мааниси жарактуу, аныкталган маанилердин диапазонуна түшөт. Жалпы мисал гендердик маалымат элементи үчүн жарактуу баалуулуктар "эркек" жана "аял" болуп саналат.]

Маалымат түрү. Маалымат атрибуту үчүн маани чындыгында ошол атрибут үчүн аныкталган маалымат түрү катары сакталат. Дүкөндүн аталышы талаасынын маалымат түрү "текст" катары аныкталганда, ал талаанын бардык инстанциялары сандык коддорду эмес, тексттик форматта көрсөтүлгөн дүкөндүн аталышын камтыйт.
[Маалымат түрү. Маалымат атрибутунун мааниси чындыгында ошол атрибут үчүн аныкталган маалымат түрү катары сакталат. Эгер дүкөндүн аталышы талаасынын маалымат түрү "текст" деп аныкталса, бул талаанын бардык инстанциялары сандык коддордон көрө текст форматында көрсөтүлгөн дүкөндүн аталышын камтыйт.]

ырааттуулук. Маалымат талаасынын формасы жана мазмуну бир нече булак системаларында бирдей. Эгерде бир системадагы ABC продуктунун продукт коду 1234 болсо, анда бул продукттун коду ар бир булак тутумунда 1234 болуп саналат.
[ырааттуулук. Маалымат талаасынын формасы жана мазмуну ар кандай булак системаларында бирдей. Эгерде бир системадагы ABC продуктунун продукт коду 1234 болсо, анда ал продукттун коду ар бир булак тутумунда 1234 болот.]

Артыкчылык. Бир эле маалыматтар тутумда бирден ашык жерде сакталбашы керек. Эгерде натыйжалуулук үчүн, маалымат элементи атайылап системада бир нече жерде сакталса, анда ашыкча так аныкталып, текшерилиши керек.
[Ашыкча. Бир эле маалыматтар тутумда бирден ашык жерде сакталбашы керек. Эгерде натыйжалуулук үчүн, маалымат элементи системанын бир нече жеринде атайылап сакталса, анда ашыкчалык так аныкталып, текшерилиши керек.]

Толуктуулук. Системада берилген атрибут үчүн жетишпеген маанилер жок. Мисалы, кардар файлында ар бир кардар үчүн "мамлекет" талаасы үчүн жарактуу маани болушу керек. Заказдын чоо-жайы үчүн файлда буйрутма боюнча ар бир деталдуу жазуу толугу менен толтурулушу керек.
[Толуктук. Бул атрибут үчүн тутумда жетишпеген маанилер жок. Мисалы, кардар файлы ар бир кардар үчүн "статус" талаасы үчүн жарактуу мааниге ээ болушу керек. Заказдын чоо-жайы файлында, ар бир заказдын чоо-жайы жазуусу толугу менен толтурулушу керек.]

Дубликация. Системада жазуулардын кайталанышы толугу менен чечилет. Эгерде продукт файлында кайталанма жазуулар бар экендиги белгилүү болсо, анда ар бир продукт үчүн бардык кайталанган жазуулар аныкталат жана кайчылаш шилтеме түзүлөт.
[Дубликат. Системада жазуулардын кайталанышы толук жоюлду. Эгерде продукт файлында кайталанма жазуулар бар экендиги белгилүү болсо, анда ар бир продукт үчүн бардык кайталанган жазуулар аныкталат жана кайчылаш шилтеме түзүлөт.]

Бизнес эрежелерине ылайык келүү. Ар бир маалымат пунктунун баалуулуктары белгиленген бизнес эрежелерине ылайык келет. Аукциондук системада балка же сатуу баасы резервдик баадан төмөн болушу мүмкүн эмес. Банктык кредиттик системада кредиттин калдыктары ар дайым оң же нөл болушу керек.
[Бизнес эрежелерин сактоо. Ар бир маалымат элементинин баалуулуктары белгиленген бизнес эрежелерине ылайык келет. Аукциондук системада балка же сатуу баасы резервдик баадан төмөн болушу мүмкүн эмес. Банктык кредиттик системада кредиттик баланс ар дайым оң же нөл болушу керек.]

Структуралык аныктык. Кайсы жерде маалымат элементи табигый түрдө өзүнчө компоненттерге түзүлүшү мүмкүн болсо, пункт бул так аныкталган структураны камтышы керек. Мисалы, жеке адамдын аты табигый түрдө аты, атасынын аты жана фамилиясына бөлүнөт. Жеке адамдардын аттары үчүн баалуулуктар аты, атасынын аты жана фамилиясы катары сакталышы керек. Маалыматтын сапатынын бул мүнөздөмөсү стандарттардын аткарылышын жеңилдетет жана жетишпеген маанилерди азайтат.
[Структуралык аныктык. Маалымат элементи табигый түрдө айрым компоненттерге түзүлүшү мүмкүн болгон учурда, элемент бул так аныкталган структураны камтышы керек. Мисалы, адамдын аты табигый түрдө аты, ортосунун башталышы жана фамилиясы болуп бөлүнөт. Жеке ысымдар үчүн баалуулуктар аты, атасынын аты жана фамилиясы катары сакталышы керек. Бул маалымат сапаты мүнөздөмөсү стандарттарды колдонууну жеңилдетет жана жетишпеген маанилерди азайтат.]

Маалыматтын аномалиясы. Талаа аны аныкталган максатта гана колдонулушу керек. Эгерде дарек-3 талаасы узун даректер үчүн даректин мүмкүн болуучу үчүнчү сабы үчүн аныкталса, анда бул талаа даректин үчүнчү сабын жазуу үчүн гана колдонулушу керек. Ал кардар үчүн телефон же факс номерин киргизүү үчүн колдонулбашы керек.
[Маалымат аномалиясы. Талаа аны аныкталган максат үчүн гана колдонулушу керек. Эгерде Дарек-3 талаасы узун даректер үчүн мүмкүн болуучу үчүнчү дарек сабы үчүн аныкталса, анда бул талаа үчүнчү дарек сабын жазуу үчүн гана колдонулат. Бул кардар үчүн телефон же факс номерин киргизүү үчүн колдонулбашы керек.]

Ачыктык. Берилиш элементи сапаттуу маалыматтардын бардык башка мүнөздөмөлөрүнө ээ болушу мүмкүн, бирок эгерде колдонуучулар анын маанисин так түшүнбөсө, анда маалымат элементи колдонуучулар үчүн эч кандай мааниге ээ эмес. Туура ат коюу конвенциялары маалымат элементтерин колдонуучуларга жакшы түшүнүүгө жардам берет.
[Ачыктык. Берилиш элементи жакшы маалыматтардын бардык башка мүнөздөмөлөрүнө ээ болушу мүмкүн, бирок колдонуучулар анын маанисин так түшүнбөсө, анда маалымат элементи колдонуучулар үчүн эч кандай мааниге ээ эмес. Туура атоо конвенциялары маалымат элементтерин колдонуучуларга жакшы түшүнүүгө жардам берет.]

Өз убагында. Колдонуучулар маалыматтардын өз убагында экендигин аныктайт. Эгерде колдонуучулар кардар өлчөмүнүн маалыматтары бир күндөн ашпасын деп күтүшсө, булак системаларындагы кардар маалыматтарына өзгөртүүлөр күн сайын маалымат кампасына колдонулушу керек.
[Өз убагында. Колдонуучулар маалыматтардын актуалдуулугун аныктайт. Эгерде колдонуучулар кардар өлчөмүнүн маалыматтары бир күндөн ашык эмес деп күтсө, булак тутумдарындагы кардар маалыматтарына өзгөртүүлөр күн сайын маалымат кампасына колдонулушу керек.]

Пайдалуулугу. Маалымат кампасында ар бир маалымат элементи колдонуучулардын коллекциясынын кээ бир талаптарына жооп бериши керек. Маалымат элементи так жана жогорку сапатта болушу мүмкүн, бирок ал колдонуучулар үчүн эч кандай мааниге ээ болбосо, анда ал маалымат элементинин маалымат кампасында болушу таптакыр кереги жок.
[Utility. Маалыматтар сактагычындагы ар бир маалымат элементи колдонуучунун коллекциясынын кээ бир талаптарына жооп бериши керек. Берилиш элементи так жана жогорку сапатта болушу мүмкүн, бирок ал колдонуучуларга баалуулук бербесе, анда ал маалымат элементинин маалымат кампасында болушунун зарылчылыгы жок.]

Маалыматтардын бүтүндүгү эрежелерин сактоо. Булак тутумдарынын реляциялык маалымат базаларында сакталган маалыматтар объектинин бүтүндүгүн жана маалымдама бүтүндүгүнүн эрежелерин сактоого тийиш. Негизги ачкыч катары нөлгө уруксат берген таблица объектинин бүтүндүгүнө ээ эмес. Шилтеменин бүтүндүгү ата-эне менен баланын мамилесин туура түзүүгө мажбурлайт. Кардар менен заказга болгон мамиледе маалымдама бүтүндүгү маалымат базасындагы ар бир буйрутма үчүн кардардын болушун камсыздайт.
[Маалыматтардын бүтүндүгү эрежелерин сактоо. Булак системаларынын реляциялык маалымат базаларында сакталган маалыматтар объектинин бүтүндүгү жана маалымдама бүтүндүгү эрежелерине ылайык келүүгө тийиш. Негизги ачкыч катары нөлгө уруксат берген таблица объектинин бүтүндүгүнө ээ эмес. Шилтемелердин бүтүндүгү ата-эне менен балдардын ортосундагы мамилени туура түзүүгө мажбурлайт. Кардар менен буйрутма мамилесинде маалымдама бүтүндүгү маалымат базасындагы ар бир буйрутма үчүн кардар бар экендигин камсыздайт.]

4. Маалыматтарды тазалоонун сапаты

Маалыматтарды тазалоонун сапаты чоң маалыматтарда бир топ көйгөйлүү маселе. Тапшырманы аткаруу үчүн маалыматтарды тазалоо канчалык деңгээлде керек деген суроого жооп берүү ар бир аналитик үчүн негизги болуп саналат. Көпчүлүк учурдагы көйгөйлөрдө ар бир талдоочу муну өзү аныктайт жана анын чечилишинде бул аспекти сырттан эч ким баалай албашы күмөн. Бирок, бул маселе үчүн, бул маселе өтө маанилүү болгон, анткени юридикалык маалыматтардын ишенимдүүлүгү бир болушу керек.

Иштин ишенимдүүлүгүн аныктоо үчүн программалык камсыздоону тестирлөө технологияларын карап чыгуу. Бүгүнкү күндө бул моделдер көп 200. Көптөгөн моделдер дооматты тейлөө моделин колдонушат:

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
Сүрөт. 6

Төмөнкүдөй ойлонуу: "Эгер табылган ката бул моделдеги ката окуясына окшош окуя болсо, анда t параметринин аналогун кантип табууга болот?" Жана мен төмөнкү моделди түздүм: Келгиле, бир жазууну текшерүү үчүн тестиерге 1 мүнөт кетет (каралып жаткан маалыматтар базасы үчүн), андан кийин бардык каталарды табуу үчүн ага 365 494 мүнөт керектелет, бул болжол менен 3 жыл жана 3 айлар жумуш убактысы. Биз түшүнгөндөй, бул абдан чоң жумуш жана маалымат базасын текшерүүгө кеткен чыгымдар бул маалымат базасын түзүүчү үчүн өтө чоң болот. Бул ой жүгүртүүдө чыгымдардын экономикалык концепциясы пайда болот жана талдоодон кийин мен бул кыйла натыйжалуу курал деген тыянакка келдим. Экономиканын мыйзамына таянып: «Фирманын максималдуу пайдасына жетишилген өндүрүштүн көлөмү (бирдикте) продукциянын жаңы бирдигин өндүрүүгө болгон чектүү чыгым бул фирма ала турган баа менен салыштырылган жерде жайгашкан. жаңы бирдик үчүн». Ар бир кийинки катаны табуу жазууларды көбүрөөк текшерүүнү талап кылат деген постулаттын негизинде, бул чыгым фактору болуп саналат. Башкача айтканда, моделдерди тестирлөөдө кабыл алынган постулат физикалык маанини төмөнкүдөй формада алат: эгерде i-катаны табуу үчүн n жазууну текшерүү керек болсо, анда кийинки (i+1) катаны табуу керек болот. м жазууларды текшерүүгө жана ошол эле учурда Н

  1. Жаңы ката табылганга чейин текшерилген жазуулардын саны турукташканда;
  2. Качан кийинки катаны табууга чейин текшерилген жазуулардын саны көбөйөт.

Критикалык маанини аныктоо үчүн мен экономикалык максатка ылайыктуу концепцияга кайрылдым, бул учурда социалдык чыгымдар түшүнүгүн колдонуу менен төмөнкүчө формулировкалоого болот: “Катаны оңдоого кеткен чыгымдарды жасай алган экономикалык агент көтөрүшү керек. аны эң арзан баада». Бизде бир агент бар - бир жазууну текшерүүгө 1 мүнөт сарптаган тестиер. Акчалай алганда, сиз 6000 рубль/күн тапсаңыз, бул 12,2 рублди түзөт. (болжол менен бүгүн). Экономикалык укукта тең салмактуулуктун экинчи тарабын аныктоо калды. Мен ушинтип ойлондум. Бар болгон ката аны оңдоо үчүн тиешелүү адамдан, башкача айтканда, менчик ээсинен күч-аракет жумшоону талап кылат. Бул 1 күндүк иш-аракетти талап кылат дейли (арызды тапшырыңыз, оңдолгон документти алыңыз). Ошондо социалдык жактан алып караганда анын чыгашасы бир күндүк орточо айлыкка барабар болот. Ханты-Мансий автономиялык округунда орточо чегерилген эмгек акы «Ханты-Мансийск автономиялык округунун – Угра шаарынын 2019-жылдын январь-сентябрь айларындагы социалдык-экономикалык өнүгүүсүнүн жыйынтыктары» 73285 руб. же 3053,542 рубль/күн. Демек, биз төмөнкүгө барабар критикалык маани алабыз:
3053,542: 12,2 = 250,4 жазуулардын бирдиги.

Бул социалдык көз караштан алганда, эгерде тестиер 251 жазууну текшерип, бир ката тапса, бул колдонуучу бул катаны өзү оңдогонго барабар. Демек, сыноочу кийинки катаны табуу үчүн 252 жазууну текшерүүгө барабар убакыт коротсо, анда бул учурда оңдоонун баасын колдонуучуга которуу жакшы.

Бул жерде жөнөкөйлөштүрүлгөн ыкма берилген, анткени социалдык көз караштан алганда ар бир адис тарабынан түзүлгөн бардык кошумча наркты, башкача айтканда, салыктарды жана социалдык төлөмдөрдү эсепке алуу менен чыгымдарды эске алуу зарыл, бирок модели түшүнүктүү. Бул мамилелердин натыйжасы адистерге төмөнкүдөй талап болуп саналат: IT тармагындагы адистин айлык акысы республикалык орточо көрсөткүчтөн жогору болушу керек. Эгерде анын эмгек акысы потенциалдуу маалымат базасын колдонуучулардын орточо эмгек акысынан аз болсо, анда ал өзү бардык базаны кол менен текшериши керек.

Сипатталган критерийди колдонууда маалымат базасынын сапатына биринчи талап түзүлөт:
I(tr). Критикалык каталардын үлүшү 1/250,4 = 0,39938% ашпоого тийиш. Бир аз азыраак тазалоо өнөр жайда алтын. Ал эми физикалык жактан алганда каталары бар 1459дан ашык жазуу жок.

Экономикалык чегинүү.

Чындыгында, жазууларда ушундай бир катар каталарды кетирүү менен коом төмөнкү өлчөмдөгү экономикалык жоготууларга макул болот:

1459*3053,542 = 4 455 118 рубль.

Бул сумма коомдо бул чыгымдарды азайтуу үчүн куралдардын жоктугу менен аныкталат. Демек, кимдир бирөө каталары бар жазуулардын санын, мисалы, 259га чейин кыскартууга мүмкүндүк берген технологияга ээ болсо, анда бул коомго сактап калууга мүмкүндүк берет:
1200*3053,542 = 3 664 250 рубль.

Бирок, ошол эле учурда, ал өзүнүн талантын жана ишин сурай алат, айталы - 1 миллион рубль.
Башкача айтканда, социалдык чыгымдар төмөндөйт:

3 664 250 – 1 000 000 = 2 664 250 рубль.

Негизи, бул эффект BigDat технологияларын колдонуудан кошумча нарк болуп саналат.

Бирок бул жерде бул социалдык эффект экенин эске алуу керек, ал эми маалымат базасынын ээси муниципалдык органдар болуп саналат, алардын бул маалымат базасында катталган мүлктү пайдалануудан түшкөн кирешеси 0,3% өлчөмүндө: 2,778 миллиард рубль/ жыл. Ал эми бул чыгымдар (4 455 118 рубль) аны көп түйшөлтпөйт, анткени алар менчик ээлерине өткөрүлүп берилген. Жана бул жагынан алып караганда, Bigdataда көбүрөөк тактоочу технологияларды иштеп чыгуучу бул маалымат базасынын ээсин ынандыруу жөндөмүн көрсөтүшү керек жана мындай нерселер чоң талантты талап кылат.

Бул мисалда катаны баалоо алгоритми ишенимдүүлүктү текшерүү учурунда программалык камсыздоону текшерүүнүн Шуман моделинин [2] негизинде тандалган. Интернетте таралышы жана керектүү статистикалык көрсөткүчтөрдү алуу мүмкүнчүлүгүнө байланыштуу. Методология Монахов Ю.М. "Маалыматтык системалардын функционалдык туруктуулугу", спойлердин астынан караңыз. 7-9.

Райс. 7 – 9 Шуман моделинин методологиясыRock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык

Бул материалдын экинчи бөлүгүндө Schumann моделин колдонуунун натыйжалары алынган маалыматтарды тазалоонун мисалы келтирилген.
Алынган жыйынтыктарды берейин:
Каталардын болжолдуу саны N = 3167 n.
Параметр C, ламбда жана ишенимдүүлүк функциясы:

Rock, Paper, Scissors оюну сыяктуу маалыматтарды тазалаңыз. Бул аягы бар же аягы жок оюнбу? 1-бөлүк. Теориялык
17-сүрөт

Негизинен, ламбда ар бир этапта каталар аныкталган интенсивдүүлүктүн чыныгы көрсөткүчү болуп саналат. Экинчи бөлүккө көз чаптырсаңыз, бул көрсөткүч боюнча баа саатына 42,4 катаны түздү, бул Шуман көрсөткүчү менен бир топ салыштырууга болот. Жогоруда, иштеп чыгуучулардын каталарды табуу ылдамдыгы мүнөтүнө 1 жазууну текшерүүдө 250,4 жазуусуна 1 катадан кем болбошу керектиги аныкталган. Демек, Шуман модели үчүн ламбданын критикалык мааниси:

60 / 250,4 = 0,239617.

Башкача айтканда, каталарды аныктоо жол-жоболорун жүргүзүү зарылчылыгы lambda, учурдагы 38,964 0,239617 чейин төмөндөйт чейин жүзөгө ашырылышы керек.

Же N индикатору (каталардын потенциалдуу саны) минус n (каталардын оңдолгон саны) биздин кабыл алынган босогодон төмөн түшкөнгө чейин - 1459 даана.

адабият

  1. Монахов, Ю.М. Маалыматтык системалардын функционалдык туруктуулугу. 3 саатта 1-бөлүк. Программанын ишенимдүүлүгү: окуу куралы. пособие / Ю. М. Монахов; Владимир. мамлекет универ. – Владимир: Изво Владимир. мамлекет Университет, 2011. – 60 б. – ISBN 978-5-9984-0189-3.
  2. Мартин Л. Шуман, "Программанын ишенимдүүлүгүн болжолдоо үчүн ыктымалдык моделдер."
  3. IT адистери үчүн маалымат кампасынын негиздери / Полрадж Понниах.—2-бас.

Экинчи бөлүм. теориялык

Source: www.habr.com

Комментарий кошуу