Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын

1. Анхны өгөгдөл

Өгөгдөл цэвэрлэх нь өгөгдөлд дүн шинжилгээ хийхэд тулгардаг бэрхшээлүүдийн нэг юм. Энэхүү материал нь кадастрын үнэ цэнийг бүрдүүлэхэд мэдээллийн санд дүн шинжилгээ хийх практик асуудлыг шийдсэний үр дүнд бий болсон хөгжил, шийдлүүдийг тусгасан болно. Эх сурвалжууд энд байна "Ханты-Мансийскийн автономит тойрог - Уграгийн нутаг дэвсгэрт байрлах бүх төрлийн үл хөдлөх хөрөнгийн (газараас бусад) улсын кадастрын үнэлгээний үр дүнгийн талаархи 01/OKS-2019 тоот тайлан".

“Хавсралт Б. КС-ийг тодорхойлсон үр дүн 5. Кадастрын үнэ цэнийг тодорхойлох аргын мэдээлэл 5.1 Харьцуулсан арга барил”-ын “Харьцуулсан загвар нийт.од” файлыг авч үзсэн.

Хүснэгт 1. “Харьцуулсан загвар нийт.од” файл дахь өгөгдлийн багцын статистик үзүүлэлт.
Талбайн нийт тоо, ширхэг. - 44
Нийт бичлэгийн тоо, ширхэг. - 365 490
Нийт тэмдэгтийн тоо, ширхэг. - 101 714 693
Бичлэг дэх тэмдэгтүүдийн дундаж тоо, ширхэг. - 278,297
Бичлэг дэх тэмдэгтүүдийн стандарт хазайлт, ширхэг. - 15,510
Оруулсан тэмдэгтүүдийн хамгийн бага тоо, ширхэг. - 198
Оруулсан тэмдэгтүүдийн хамгийн их тоо, ширхэг. - 363

2. Оршил хэсэг. Үндсэн стандартууд

Тодорхойлсон мэдээллийн санд дүн шинжилгээ хийх явцад цэвэршүүлэх зэрэгт тавигдах шаардлагыг тодорхойлох даалгавар бий болсон, учир нь энэ мэдээллийн сан нь хэрэглэгчдэд хууль эрх зүйн болон эдийн засгийн үр дагаврыг бий болгодог. Ажлын явцад том өгөгдлийг цэвэрлэх зэрэгт тодорхой шаардлага тавьдаггүй нь тогтоогдсон. Энэ асуудалд хууль эрх зүйн хэм хэмжээг шинжилж үзэхэд тэдгээр нь бүгд боломжоос бүрддэг гэсэн дүгнэлтэд хүрсэн. Өөрөөр хэлбэл, тодорхой даалгавар гарч ирж, даалгаврын хувьд мэдээллийн эх сурвалжийг эмхэтгэж, дараа нь өгөгдлийн багцыг бүрдүүлж, үүсгэсэн өгөгдлийн багц дээр үндэслэн асуудлыг шийдвэрлэх хэрэгслүүдийг бий болгодог. Үүний үр дүнд гарсан шийдлүүд нь хувилбаруудаас сонгоход туслах цэг болно. Би үүнийг 1-р зурагт үзүүлэв.

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын

Аливаа стандартыг тодорхойлохдоо батлагдсан технологид найдах нь зүйтэй тул би энэ хэсэгт заасан шаардлагыг сонгосон. "MHRA GxP өгөгдлийн нэгдмэл байдлын тодорхойлолт ба үйлдвэрлэлийн удирдамж", учир нь би энэ баримт бичгийг энэ асуудлын хувьд хамгийн өргөн хүрээтэй гэж үзсэн. Ялангуяа энэ баримт бичгийн хэсэгт "Өгөгдлийн бүрэн бүтэн байдлын шаардлага нь гарын авлага (цаасан) болон цахим өгөгдөлд адил хамаарна гэдгийг тэмдэглэх нь зүйтэй." (орчуулга: “...өгөгдлийн бүрэн бүтэн байдлын шаардлага нь гарын авлага (цаасан) болон цахим өгөгдөлд адил хамаарна”). Энэхүү томъёолол нь Иргэний хэрэг шүүхэд хянан шийдвэрлэх тухай хуулийн 71 дүгээр зүйлд заасан "бичмэл нотлох баримт" гэсэн ойлголттой нэлээд холбоотой байдаг. 70 CAS, Art. 75 APC, "бичгээр" Art. 84 Иргэний хэрэг шүүхэд хянан шийдвэрлэх тухай хууль.

Зураг 2-т хууль зүйн шинжлэх ухаанд мэдээллийн төрлүүдэд хандах хандлагыг бүрдүүлэх бүдүүвчийг үзүүлэв.

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Цагаан будаа. 2. Эх сурвалж энд.

Зураг 3-т дээрх "Удирдамж" -ын даалгаврын хувьд Зураг 1-ийн механизмыг үзүүлэв. Мэдээллийн системийн орчин үеийн стандартын мэдээллийн бүрэн бүтэн байдлын шаардлагыг хангахад ашигладаг арга барилууд нь мэдээллийн хууль эрх зүйн ойлголттой харьцуулахад мэдэгдэхүйц хязгаарлагдмал байгааг харьцуулах замаар харахад хялбар байдаг.

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Зураг 3

Зааварт заасан баримт бичигт (Удирдамж) техникийн хэсэгтэй холболт, өгөгдлийг боловсруулах, хадгалах чадварыг 18.2-р бүлгийн ишлэлээр баталгаажуулсан болно. Харилцааны мэдээллийн сан: "Өгөгдөл нь өгөгдөл болон мета өгөгдлийн хоорондын хамаарлыг хадгалдаг том файлын форматад хадгалагддаг тул энэ файлын бүтэц нь угаасаа илүү аюулгүй байдаг."

Үнэн хэрэгтээ энэ арга барилд - одоо байгаа техникийн боломжуудаас харахад хэвийн бус зүйл байхгүй бөгөөд энэ нь өөрөө байгалийн үйл явц юм, учир нь үзэл баримтлалыг өргөжүүлэх нь хамгийн их судлагдсан үйл ажиллагаа болох мэдээллийн сангийн дизайнаас үүдэлтэй юм. Гэхдээ нөгөө талаас, одоо байгаа системийн техникийн чадавхид хөнгөлөлт үзүүлэхгүй хууль эрх зүйн хэм хэмжээнүүд гарч ирдэг, жишээлбэл: GDPR - Мэдээллийг хамгаалах ерөнхий журам.

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Цагаан будаа. 4. Техникийн чадавхийн юүлүүр (Эх сурвалж).

Эдгээр талаас харахад анхны өгөгдлийн багц (Зураг 1) нь юуны түрүүнд хадгалагдах, хоёрдугаарт, үүнээс нэмэлт мэдээлэл авах үндэс суурь болох нь тодорхой болж байна. Жишээлбэл, замын хөдөлгөөний дүрмийг бүртгэдэг камерууд хаа сайгүй байдаг, мэдээлэл боловсруулах систем нь зөрчигчдийг устгадаг боловч бусад мэдээллийг бусад хэрэглэгчдэд санал болгож болно, жишээлбэл, худалдааны төв рүү үйлчлүүлэгчдийн урсгалын бүтцийг маркетингийн хяналт гэх мэт. Энэ нь BigDat-ийг ашиглахад нэмэлт үнэ цэнийн эх үүсвэр юм. Одоо, ирээдүйд хаа нэгтээ цуглуулж байгаа мэдээллийн багцууд нь одоогийн 1700-ийн ховор хэвлэлүүдийн үнэ цэнтэй төстэй механизмын дагуу үнэ цэнэтэй байх бүрэн боломжтой юм. Эцсийн эцэст, түр зуурын өгөгдлийн багц нь өвөрмөц бөгөөд ирээдүйд дахин давтагдах магадлал багатай юм.

3. Оршил хэсэг. Үнэлгээний шалгуур

Боловсруулалтын явцад алдааны дараах ангиллыг боловсруулсан.

1. Алдааны ангилал (ГОСТ R 8.736-2011 дээр үндэслэсэн): a) системчилсэн алдаа; б) санамсаргүй алдаа; в) бүдүүлэг алдаа.

2. Олон талт байдлаар: a) моно гажуудал; б) олон гажуудал.

3. Үр дагаврын шүүмжлэлийн дагуу: а) эгзэгтэй; б) шүүмжлэлтэй биш.

4. Үүссэн эх сурвалжаар:

A) Техникийн - тоног төхөөрөмжийг ажиллуулах явцад гарсан алдаа. IoT систем, харилцаа холбооны чанар, тоног төхөөрөмж (техник хангамж) зэрэгт ихээхэн нөлөөлдөг системүүдийн хувьд нэлээд хамааралтай алдаа.

B) Операторын алдаа - оролтын үеийн операторын алдаанаас эхлээд мэдээллийн сангийн дизайны техникийн үзүүлэлтүүдийн алдаа хүртэл өргөн хүрээний алдаа.

C) Хэрэглэгчийн алдаа - энд "байршил солихоо мартсан"-аас эхлээд тоолуурыг хөл гэж андуурах хүртэлх бүх хүрээн дэх хэрэглэгчийн алдаа энд байна.

5. Тусдаа ангид хуваасан:

a) "салгагчийн даалгавар", өөрөөр хэлбэл орон зай ба ":" (бидний тохиолдолд) давхардсан үед;
б) хамт бичсэн үгс;
в) үйлчилгээний тэмдэгтүүдийн дараа хоосон зай байхгүй
г) тэгш хэмтэй олон тэмдэгтүүд: (), "", "...".

Зураг 5-д үзүүлсэн мэдээллийн сангийн алдааг системчилснээр алдаа хайх, энэ жишээнд өгөгдөл цэвэрлэх алгоритмыг боловсруулахад нэлээд үр дүнтэй координатын системийг бий болгосон.

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Цагаан будаа. 5. Өгөгдлийн сангийн бүтцийн нэгжид тохирох ердийн алдаанууд (Эх сурвалж: Орешков В.И., Паклин Н.Б. "Өгөгдлийн нэгтгэлийн гол ойлголтууд").

Нарийвчлал, Домэйн бүрэн бүтэн байдал, Өгөгдлийн төрөл, Тогтвортой байдал, Илүүдэл, Бүрэн байдал, Давхардал, Бизнесийн дүрэмд нийцсэн байдал, Бүтцийн тодорхой байдал, Өгөгдлийн гажиг, Тодорхой байдал, Цаг хугацаа, Өгөгдлийн бүрэн бүтэн байдлын дүрмийг дагаж мөрдөх. (Хуудас 334. Мэдээллийн технологийн мэргэжилтнүүдэд зориулсан мэдээллийн агуулахын үндэс / Paulraj Ponniah.—2-р хэвлэл)

Англи хэллэг, орос машин орчуулгыг хаалтанд оруулав.

Нарийвчлал. Өгөгдлийн элементийн системд хадгалагдсан утга нь тухайн өгөгдлийн элементийн тохиолдлын зөв утга юм. Хэрэв танд хэрэглэгчийн нэр болон бүртгэлд хадгалагдсан хаяг байгаа бол тухайн хаяг нь тухайн харилцагчийн зөв хаяг юм. Хэрэв та 1000 тоот захиалгын бүртгэлээс захиалсан тоо хэмжээг 12345678 нэгжээр олвол тухайн тоо хэмжээ нь тухайн захиалгын үнэн зөв тоо байна.
[Нягт байдал. Өгөгдлийн элементийн системд хадгалагдсан утга нь тухайн өгөгдлийн элементийн тохиолдлын зөв утга юм. Хэрэв та хэрэглэгчийн нэр, хаягийг бүртгэлд хадгалсан бол тухайн хаяг нь тухайн харилцагчийн зөв хаяг болно. Хэрэв та 1000 дугаар захиалгын бүртгэлээс захиалсан тоо хэмжээг 12345678 нэгжээр олвол тэр тоо хэмжээ нь тухайн захиалгын яг тоо байна.]

Домэйн бүрэн бүтэн байдал. Атрибутын өгөгдлийн утга нь зөвшөөрөгдөх, тодорхойлсон утгуудын хүрээнд багтдаг. Нийтлэг жишээ бол жендэрийн өгөгдлийн элементийн "эрэгтэй" ба "эм" гэсэн зөвшөөрөгдөх утгууд юм.
[Домэйн бүрэн бүтэн байдал. Өгөгдлийн шинж чанарын утга нь хүчинтэй, тодорхойлсон утгуудын хүрээнд багтдаг. Ерөнхий жишээ бол жендэрийн өгөгдлийн элементийн "эрэгтэй" ба "эм" гэсэн хүчинтэй утгууд юм.]

Өгөгдлийн төрөл. Өгөгдлийн атрибутын утгыг тухайн атрибутад тодорхойлсон өгөгдлийн төрлөөр хадгалдаг. Дэлгүүрийн нэрийн талбарын өгөгдлийн төрлийг "текст" гэж тодорхойлсон тохиолдолд тухайн талбарын бүх тохиолдлууд тоон код биш харин текст хэлбэрээр харуулсан дэлгүүрийн нэрийг агуулна.
[Өгөгдлийн төрөл. Өгөгдлийн атрибутын утгыг тухайн атрибутад тодорхойлсон өгөгдлийн төрөл болгон хадгалдаг. Хэрэв дэлгүүрийн нэрийн талбарын өгөгдлийн төрлийг "текст" гэж тодорхойлсон бол энэ талбарын бүх тохиолдлууд тоон код биш харин текст хэлбэрээр харуулсан дэлгүүрийн нэрийг агуулна.]

Тууштай байдал. Өгөгдлийн талбарын хэлбэр, агуулга нь олон эх сурвалжийн системд ижил байдаг. Хэрэв нэг систем дэх ABC бүтээгдэхүүний бүтээгдэхүүний код 1234 бол эх систем бүрт энэ бүтээгдэхүүний код 1234 байна.
[Тууштай байдал. Мэдээллийн талбарын хэлбэр, агуулга нь өөр өөр эх сурвалжийн системд ижил байдаг. Хэрэв нэг систем дээрх ABC бүтээгдэхүүний бүтээгдэхүүний код 1234 бол эх систем тус бүр дээр тухайн бүтээгдэхүүний код 1234 байна.]

Илүүдэл. Системийн нэгээс олон газар ижил өгөгдлийг хадгалах ёсгүй. Хэрэв үр ашгийн үүднээс өгөгдлийн элементийг системийн нэгээс олон газарт зориудаар хадгалсан бол илүүдлийг тодорхой тодорхойлж, баталгаажуулах ёстой.
[Нэмэлт. Системийн нэгээс олон газар ижил өгөгдлийг хадгалах ёсгүй. Хэрэв үр ашгийн үүднээс өгөгдлийн элементийг системийн олон байршилд зориудаар хадгалсан бол илүүдлийг тодорхой тодорхойлж, баталгаажуулах шаардлагатай.]

Бүрэн байдал. Системд өгөгдсөн шинж чанарын хувьд дутуу утга байхгүй. Жишээлбэл, хэрэглэгчийн файлд "төлөв" талбарт үйлчлүүлэгч бүрийн хүчинтэй утга байх ёстой. Захиалгын дэлгэрэнгүй мэдээлэл бүхий файлд захиалгын дэлгэрэнгүй бүртгэл бүрийг бүрэн бөглөсөн байх ёстой.
[Бүрэн байдал. Энэ шинж чанарын системд дутуу утга байхгүй байна. Жишээлбэл, үйлчлүүлэгчийн файл нь үйлчлүүлэгч бүрийн хувьд "статус" талбарт хүчинтэй утгатай байх ёстой. Захиалгын дэлгэрэнгүй файлд захиалгын дэлгэрэнгүй бүртгэл бүрийг бүрэн бөглөсөн байх ёстой.]

Давхардал. Систем дэх бүртгэлийн давхардал бүрэн шийдэгддэг. Хэрэв бүтээгдэхүүний файлд давхардсан бүртгэл байгаа нь мэдэгдэж байгаа бол бүтээгдэхүүн бүрийн давхардсан бүх бүртгэлийг тодорхойлж, хөндлөн лавлагаа үүсгэнэ.
[Давхардсан. Систем дэх бүртгэлийн давхардлыг бүрэн арилгасан. Хэрэв бүтээгдэхүүний файлд давхардсан оруулгууд байгаа нь мэдэгдэж байгаа бол бүтээгдэхүүн бүрийн давхардсан бүх оруулгуудыг тодорхойлж, хөндлөн лавлагаа үүсгэнэ.]

Бизнесийн дүрэмд нийцүүлэх. Өгөгдлийн зүйл бүрийн үнэ цэнэ нь тогтоосон бизнесийн дүрэмд нийцдэг. Дуудлага худалдааны системд алх буюу худалдах үнэ нь нөөц үнээс бага байж болохгүй. Банкны зээлийн системд зээлийн үлдэгдэл үргэлж эерэг эсвэл тэг байх ёстой.
[Бизнесийн дүрмийг дагаж мөрдөх. Өгөгдлийн элемент бүрийн утга нь тогтоосон бизнесийн дүрэмд нийцдэг. Дуудлага худалдааны системд алх буюу худалдах үнэ нь нөөц үнээс бага байж болохгүй. Банкны зээлийн системд зээлийн үлдэгдэл үргэлж эерэг эсвэл тэг байх ёстой.]

Бүтцийн тодорхой байдал. Өгөгдлийн зүйл нь бие даасан бүрэлдэхүүн хэсгүүдэд хуваагдах боломжтой газар бүр нь энэхүү сайн тодорхойлсон бүтцийг агуулсан байх ёстой. Жишээлбэл, хувь хүний ​​нэр нь төрөлхийн нэр, дундын эхний эхний болон овог гэж хуваагддаг. Хувь хүмүүсийн нэрсийн утгыг овог нэр, овог нэр, овог нэрээр хадгалах ёстой. Өгөгдлийн чанарын энэхүү шинж чанар нь стандартын хэрэгжилтийг хялбарчилж, алдагдсан утгыг багасгадаг.
[Бүтцийн тодорхой байдал. Өгөгдлийн элементийг бие даасан бүрэлдэхүүн хэсгүүдэд байгалийн бүтэцтэй болгох боломжтой тохиолдолд элемент нь энэхүү сайн тодорхойлсон бүтцийг агуулсан байх ёстой. Жишээлбэл, хүний ​​нэрийг угаасаа овог нэр, дундын эхний эхний нэр, овог нэр гэж хуваадаг. Хувь хүний ​​нэрсийн утгыг нэр, дундын эхний эхний болон овог нэрээр хадгалах ёстой. Энэхүү өгөгдлийн чанарын шинж чанар нь стандартын хэрэглээг хялбарчилж, алдагдсан утгыг багасгадаг.]

Өгөгдлийн аномали. Талбарыг зөвхөн тодорхойлсон зорилгоор ашиглах ёстой. Хэрвээ Хаяг-3 талбар нь урт хаягуудын аль нэг гуравдахь мөрийн хаягийн хувьд тодорхойлогдсон бол энэ талбарыг зөвхөн хаягийн гурав дахь мөрийг бичихэд ашиглах ёстой. Үүнийг харилцагчийн утас, факсын дугаар оруулахад ашиглаж болохгүй.
[Өгөгдлийн гажиг. Талбарыг зөвхөн тодорхойлсон зорилгоор ашиглах ёстой. Хэрвээ Хаяг-3 талбар нь урт хаягуудын аль нэг боломжтой гурав дахь хаягийн мөрөнд тодорхойлогдсон бол энэ талбарыг зөвхөн гурав дахь хаягийн мөрийг бүртгэхэд ашиглана. Үүнийг харилцагчийн утас, факсын дугаар оруулахад ашиглаж болохгүй.]

Тодорхой байдал. Өгөгдлийн элемент нь чанарын өгөгдлийн бусад бүх шинж чанарыг агуулж болох боловч хэрэв хэрэглэгчид түүний утгыг тодорхой ойлгохгүй байвал өгөгдлийн элемент нь хэрэглэгчдэд ямар ч үнэ цэнэгүй болно. Зөв нэрлэх дүрэм нь өгөгдлийн элементүүдийг хэрэглэгчдэд сайн ойлгуулахад тусалдаг.
[Тодорхой байдал. Өгөгдлийн элемент нь сайн өгөгдлийн бусад бүх шинж чанартай байж болох ч хэрэв хэрэглэгчид түүний утгыг тодорхой ойлгохгүй байвал өгөгдлийн элемент нь хэрэглэгчдэд ямар ч үнэ цэнэгүй болно. Зөв нэрлэх дүрэм нь өгөгдлийн элементүүдийг хэрэглэгчдэд сайн ойлгуулахад тусалдаг.]

Цаг үеэ олсон. Мэдээллийн цаг үеийн байдлыг хэрэглэгчид тодорхойлдог. Хэрэв хэрэглэгчид хэрэглэгчийн хэмжээсийн өгөгдлийг нэг хоногоос илүүгүй гэж үзэж байгаа бол эх систем дэх хэрэглэгчийн өгөгдөлд хийсэн өөрчлөлтийг өдөр бүр мэдээллийн агуулахад оруулах ёстой.
[Цаг тухайд нь. Хэрэглэгчид өгөгдлийн цаг үеийн байдлыг тодорхойлдог. Хэрэв хэрэглэгчид хэрэглэгчийн хэмжээсийн өгөгдлийг нэг хоногоос илүүгүй байхаар хүлээж байгаа бол эх систем дэх хэрэглэгчийн өгөгдөлд хийсэн өөрчлөлтийг өдөр бүр мэдээллийн агуулахад оруулах ёстой.]

Ашигтай байдал. Өгөгдлийн агуулах дахь өгөгдлийн элемент бүр нь хэрэглэгчдийн цуглуулах зарим шаардлагыг хангасан байх ёстой. Өгөгдлийн элемент нь үнэн зөв, өндөр чанартай байж болох ч хэрэглэгчдэд ямар ч үнэ цэнэгүй бол тухайн өгөгдлийн элемент нь мэдээллийн агуулахад байх шаардлагагүй болно.
[Ашиглалт. Мэдээллийн сан дахь өгөгдлийн зүйл бүр нь хэрэглэгчийн цуглуулгын зарим шаардлагыг хангасан байх ёстой. Өгөгдлийн элемент нь үнэн зөв, өндөр чанартай байж болох ч хэрэв хэрэглэгчдэд үнэ цэнийг өгөхгүй бол тухайн өгөгдлийн элемент өгөгдлийн агуулахад байх шаардлагагүй.]

Өгөгдлийн бүрэн бүтэн байдлын дүрмийг дагаж мөрдөх. Эх системийн харилцааны мэдээллийн санд хадгалагдсан өгөгдөл нь байгууллагын бүрэн бүтэн байдал, лавлагааны бүрэн бүтэн байдлын дүрмийг дагаж мөрдөх ёстой. Анхдагч түлхүүр болгон null-г зөвшөөрдөг аливаа хүснэгтийн бүрэн бүтэн байдал байхгүй. Лавлах бүрэн бүтэн байдал нь эцэг эх, хүүхдийн харилцааг зөв тогтооход хүргэдэг. Үйлчлүүлэгчээс захиалгын харилцааны хувьд лавлагааны бүрэн бүтэн байдал нь мэдээллийн сан дахь захиалга бүрт үйлчлүүлэгч байгаа эсэхийг баталгаажуулдаг.
[Өгөгдлийн бүрэн бүтэн байдлын дүрмийг дагаж мөрдөх. Эх системийн харилцааны мэдээллийн санд хадгалагдсан өгөгдөл нь байгууллагын бүрэн бүтэн байдал, лавлагааны бүрэн бүтэн байдлын дүрэмд нийцсэн байх ёстой. null-ийг үндсэн түлхүүр болгон зөвшөөрдөг аливаа хүснэгтэд объектын бүрэн бүтэн байдал байхгүй. Лавлагааны бүрэн бүтэн байдал нь эцэг эх, хүүхдийн хоорондын харилцааг зөв тогтооход хүргэдэг. Үйлчлүүлэгч ба захиалгын харилцааны хувьд лавлагааны бүрэн бүтэн байдал нь мэдээллийн санд байгаа захиалга бүрт үйлчлүүлэгч байгаа эсэхийг баталгаажуулдаг.]

4. Өгөгдлийн цэвэрлэгээний чанар

Өгөгдөл цэвэрлэх чанар нь bigdata-д нэлээд бэрхшээлтэй асуудал юм. Даалгаврыг дуусгахын тулд ямар хэмжээний өгөгдөл цэвэрлэх шаардлагатай вэ гэсэн асуултанд хариулах нь өгөгдлийн шинжээч бүрийн хувьд чухал юм. Орчин үеийн ихэнх асуудалд шинжээч бүр үүнийг өөрөө тодорхойлдог бөгөөд гаднаас хэн ч түүний шийдэлд энэ талыг үнэлэх боломжгүй юм. Гэхдээ хууль эрх зүйн мэдээллийн найдвартай байдал нэг байх ёстой тул энэ тохиолдолд тулгарч буй ажлын хувьд энэ асуудал маш чухал байсан.

Үйл ажиллагааны найдвартай байдлыг тодорхойлохын тулд програм хангамжийн туршилтын технологийг авч үзэх. Өнөөдөр эдгээр загвараас илүү олон загвар бий 200. Ихэнх загварууд нэхэмжлэлийн үйлчилгээний загварыг ашигладаг:

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Зураг. 6

Дараахь байдлаар бодож байна: "Хэрэв олдсон алдаа нь энэ загвар дахь бүтэлгүйтлийн үйл явдалтай төстэй үйл явдал бол t параметрийн аналогийг хэрхэн олох вэ?" Тэгээд би дараах загварыг эмхэтгэсэн: Тестер нэг бичлэгийг шалгахад 1 минут зарцуулдаг гэж төсөөлөөд үз дээ (мэдээлийн сангийн хувьд), дараа нь бүх алдааг олохын тулд түүнд 365 минут шаардлагатай бөгөөд энэ нь ойролцоогоор 494 жил 3 байна. ажлын цаг. Бидний ойлгож байгаагаар энэ бол маш их хэмжээний ажил бөгөөд мэдээллийн санг шалгах зардал нь энэхүү мэдээллийн санг эмхэтгэгчийн хувьд маш их байх болно. Энэхүү эргэцүүлэн бодоход зардлын эдийн засгийн ойлголт гарч ирсэн бөгөөд дүн шинжилгээ хийсний дараа би энэ нь нэлээд үр дүнтэй хэрэгсэл юм гэсэн дүгнэлтэд хүрсэн. Эдийн засгийн хуулинд үндэслэн: "Пүүсийн хамгийн их ашиг хүртэх үйлдвэрлэлийн хэмжээ (нэгжээр) нь шинэ нэгж бүтээгдэхүүн үйлдвэрлэх ахиу зардлыг энэ пүүсийн авч чадах үнэтэй харьцуулах цэг дээр байрладаг. шинэ нэгжийн хувьд." Дараагийн алдаа бүрийг олохын тулд бүртгэлийг улам бүр шалгах шаардлагатай гэсэн үндсэн дээр үндэслэн энэ нь зардлын хүчин зүйл юм. Өөрөөр хэлбэл, туршилтын загварт батлагдсан постулат нь дараах загвараар физик утгыг олж авдаг: хэрэв i-р алдааг олохын тулд n бичлэгийг шалгах шаардлагатай байсан бол дараагийн (i+3) алдааг олох шаардлагатай болно. m бүртгэлийг шалгах ба нэгэн зэрэг n

  1. Шинэ алдаа олдохоос өмнө шалгасан бичлэгийн тоо тогтворжих үед;
  2. Дараагийн алдааг олохын өмнө шалгасан бичлэгийн тоо нэмэгдэхэд.

Чухал үнэ цэнийг тодорхойлохын тулд би эдийн засгийн үндэслэлийн үзэл баримтлалд хандсан бөгөөд энэ тохиолдолд нийгмийн зардлын тухай ойлголтыг ашиглан дараах байдлаар томъёолж болно: "Алдааг засах зардлыг эдийн засгийн төлөөлөгч хариуцах ёстой. хамгийн бага зардлаар." Бидэнд нэг агент байдаг - нэг бичлэгийг шалгахад 1 минут зарцуулдаг тестер. Мөнгөн дүнгээр, хэрэв та өдөрт 6000 рубль олдог бол энэ нь 12,2 рубль болно. (ойролцоогоор өнөөдөр). Эдийн засгийн эрх зүй дэх тэнцвэрт байдлын хоёр дахь талыг тодорхойлох нь хэвээр байна. Би ийм үндэслэл гаргасан. Одоо байгаа алдаа нь холбогдох хүнээс, өөрөөр хэлбэл өмчлөгчөөс үүнийг засахын тулд хүчин чармайлт гаргахыг шаарддаг. Үүнд 1 өдрийн үйлдэл шаардлагатай гэж бодъё (өргөдөл илгээх, зассан баримт бичгийг хүлээн авах). Тэгвэл нийгмийн талаас нь авч үзвэл түүний зардал өдрийн дундаж цалинтай тэнцэнэ. Ханты-Мансий автономит тойрогт хуримтлагдсан дундаж цалин "Ханты-Мансийскийн автономит тойрог - Уграгийн нийгэм, эдийн засгийн хөгжлийн 2019 оны XNUMX-XNUMX-р сарын үр дүн" 73285 рубль. эсвэл 3053,542 рубль / өдөр. Үүний дагуу бид дараахтай тэнцүү чухал утгыг авна.
3053,542: 12,2 = 250,4 нэгж бичлэг.

Энэ нь нийгмийн үүднээс авч үзвэл шалгагч 251 бичлэгийг шалгаад нэг алдаа олсон бол хэрэглэгч өөрөө энэ алдааг зассантай тэнцэнэ гэсэн үг. Үүний дагуу, шалгагч дараагийн алдааг олохын тулд 252 бичлэгийг шалгахтай тэнцэх хугацаа зарцуулсан бол энэ тохиолдолд засварын зардлыг хэрэглэгч рүү шилжүүлэх нь дээр.

Нийгмийн үүднээс авч үзвэл мэргэжилтэн бүрийн бий болгосон бүх нэмэлт үнэ цэнэ, өөрөөр хэлбэл татвар, нийгмийн төлбөр зэрэг зардлыг харгалзан үзэх шаардлагатай боловч загвар нь тодорхой байна. Энэхүү харилцааны үр дагавар нь мэргэжилтнүүдэд тавигдах дараах шаардлага юм: Мэдээллийн технологийн салбарын мэргэжилтэн улсын дунджаас өндөр цалинтай байх ёстой. Хэрэв түүний цалин өгөгдлийн сангийн боломжит хэрэглэгчдийн дундаж цалингаас бага байвал тэр өөрөө мэдээллийн баазыг бүхэлд нь гараар шалгах ёстой.

Тайлбарласан шалгуурыг ашиглахдаа мэдээллийн сангийн чанарт тавигдах эхний шаардлагыг бий болгоно.
I(tr). Чухал алдааны эзлэх хувь 1/250,4 = 0,39938% -иас хэтрэхгүй байх ёстой. -аас арай бага цэвэршүүлэх аж үйлдвэрт алт . Мөн физикийн хувьд алдаатай 1459-өөс илүүгүй бичлэг байна.

Эдийн засгийн ухралт.

Үнэн хэрэгтээ бүртгэлд ийм олон алдаа гаргаснаар нийгэм дараахь хэмжээний эдийн засгийн алдагдлыг хүлээн зөвшөөрдөг.

1459*3053,542 = 4 рубль.

Нийгэмд эдгээр зардлыг бууруулах арга хэрэгсэл байхгүйгээс энэ хэмжээ тодорхойлогддог. Хэрэв хэн нэгэн алдаатай бичлэгийн тоог, жишээлбэл, 259 хүртэл бууруулах боломжийг олгодог технологитой бол энэ нь нийгэмд хэмнэлт гаргах боломжийг олгоно.
1200*3053,542 = 3 рубль.

Гэсэн хэдий ч тэр өөрийн авьяас чадвар, хөдөлмөрийг хүсч болно, 1 сая рубль гэж хэлье.
Өөрөөр хэлбэл, нийгмийн зардлыг дараахь байдлаар бууруулна.

3 - 664 = 250 рубль.

Үндсэндээ энэ нөлөө нь BigDat технологийг ашигласнаар нэмүү өртөг юм.

Гэхдээ энэ нь нийгмийн үр дагавар бөгөөд мэдээллийн сангийн эзэмшигч нь хотын захиргааны байгууллагууд бөгөөд энэ мэдээллийн санд бүртгэгдсэн эд хөрөнгийг ашигласнаас олсон орлого нь 0,3% -иар: 2,778 тэрбум рубль / гэдгийг анхаарч үзэх хэрэгтэй. жил. Эдгээр зардал (4 рубль) нь үл хөдлөх хөрөнгийн өмчлөгчид шилжсэн тул түүнд тийм ч их санаа зовдоггүй. Мөн энэ тал дээр Bigdata дахь илүү боловсронгуй технологи хөгжүүлэгч нь энэхүү мэдээллийн сангийн эзэмшигчийг итгүүлэх чадварыг харуулах ёстой бөгөөд ийм зүйлд ихээхэн авьяас шаардагдана.

Энэ жишээнд найдвартай байдлын туршилтын явцад програм хангамжийн баталгаажуулалтын Schumann загвар [2] дээр үндэслэн алдааны үнэлгээний алгоритмыг сонгосон. Интернетэд тархсан, шаардлагатай статистик үзүүлэлтүүдийг олж авах чадвартай учраас. Арга зүйг Монахов Ю.М. "Мэдээллийн системийн үйл ажиллагааны тогтвортой байдал" -ыг Зураг дээрх спойлерын доороос үзнэ үү. 7-9.

Цагаан будаа. 7 – 9 Шуманы загварын арга зүйЧулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын

Энэхүү материалын хоёр дахь хэсэгт Шуман загварыг ашиглах үр дүнг олж авсан өгөгдлийг цэвэрлэх жишээг үзүүлэв.
Хүлээн авсан үр дүнг танилцуулъя:
Тооцоолсон алдааны тоо N = 3167 n.
Параметр C, lambda ба найдвартай байдлын функц:

Чулуу, цаас, хайч тоглоом шиг өгөгдлийг цэвэрлэ. Энэ төгсгөлтэй эсвэл төгсгөлгүй тоглоом мөн үү? 1-р хэсэг. Онолын
Зураг 17

Үндсэндээ lambda нь үе шат бүрт алдаа илрэх эрчмийг илтгэдэг бодит үзүүлэлт юм. Хэрэв та хоёр дахь хэсгийг харвал энэ үзүүлэлтийн тооцоолол нь цагт 42,4 алдаа байсан бөгөөд энэ нь Schumann-ийн үзүүлэлттэй нэлээд төстэй юм. Дээр дурдсанчлан, хөгжүүлэгчийн алдааг олох хурд нь минутанд 1 бичлэгийг шалгахдаа 250,4 бичлэг тутамд 1 алдаанаас багагүй байх ёстой гэж тодорхойлсон. Тиймээс Шуманы загварын ламбдагийн чухал утга нь:

60/250,4 = 0,239617 байна.

Өөрөөр хэлбэл, одоо байгаа 38,964-аас 0,239617 хүртэл буурах хүртэл алдаа илрүүлэх процедурыг хийх шаардлагатай.

Эсвэл N үзүүлэлт (алдааны боломжит тоо) хасах n (алдааны залруулсан тоо) бидний хүлээн зөвшөөрөгдсөн босго хэмжээнээс доош буурах хүртэл - 1459 ширхэг.

Уран зохиол

  1. Монахов, Ю.М. Мэдээллийн системийн үйл ажиллагааны тогтвортой байдал. 3 цагийн дотор 1-р хэсэг. Програм хангамжийн найдвартай байдал: сурах бичиг. тэтгэмж / Ю.М.Монахов; Владимир. муж их сургууль. - Владимир: Изво Владимир. муж Их сургууль, 2011. – 60 х. – ISBN 978-5-9984-0189-3.
  2. Мартин Л.Шооман, "Програм хангамжийн найдвартай байдлын таамаглалд зориулсан магадлалын загварууд."
  3. Мэдээллийн технологийн мэргэжилтнүүдэд зориулсан мэдээллийн агуулахын үндэс / Полраж Понниа.-2-р хэвлэл.

Хоёрдугаар хэсэг. Онолын

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх