В Энэхүү нийтлэлийг Ханты-Мансий автономит тойргийн үл хөдлөх хөрөнгийн кадастрын үнэлгээний үр дүнгийн мэдээллийн багцад үндэслэн хийсэн гэж тайлбарлав.
Практик хэсгийг үе шаттайгаар үзүүлэв. Бүх цэвэрлэгээг Excel дээр хийсэн, учир нь энэ нь хамгийн түгээмэл хэрэгсэл бөгөөд тайлбарласан үйлдлүүдийг Excel-ийг мэддэг ихэнх мэргэжилтнүүд давтаж чаддаг. Мөн гар урлалын ажилд маш тохиромжтой.
Би файлыг эхлүүлэх, хадгалах ажлыг тэг шат болгон тавих болно, учир нь энэ нь 100 МБ хэмжээтэй бөгөөд эдгээр арав, зуу зуун үйлдлүүд нь ихээхэн цаг хугацаа шаарддаг.
Нээлтийн хугацаа дунджаар 30 секунд байна.
Цаг хэмнэх: 22 сек.
Эхний үе шат нь мэдээллийн багцын статистик үзүүлэлтүүдийг тодорхойлохоос эхэлдэг.
Хүснэгт 1. Өгөгдлийн багцын статистик үзүүлэлтүүд

Технологи 2.1.
Туслах талбар үүсгэх; Би үүнийг AY гэж нэрлэх болно. Бичлэг бүрийн хувьд "=LEN(F365502)+LEN(G365502)+…+LEN(AW365502)" томъёог үүсгэнэ үү.
2.1-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t21 = 1 цаг.
2.1-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n21 = 0 ширхэг.
Хоёрдугаар шат.
Өгөгдлийн багцын бүрэлдэхүүн хэсгүүдийг шалгаж байна.
2.2. Бүртгэл дэх бүх утгыг стандарт тэмдэгт ашиглан бүрдүүлдэг. Тиймээс статистикийг тэмдэгтээр нь авч үзье.
Хүснэгт 2. Үр дүнгийн урьдчилсан дүн шинжилгээ бүхий өгөгдлийн багц дахь тэмдэглэгээний статистик үзүүлэлтүүд.




Технологи 2.2.1.
Бид туслах талбарыг үүсгэдэг - "alpha1". Бичлэг бүрийн хувьд бид “=CONCATENATE(Sheet1!B9;…Sheet1!AQ9)” томъёог үүсгэдэг.
Бид "Омега-1" хэмээх суурин эсийг үүсгэнэ. Бид энэ нүдэнд 32-255 хүртэлх Windows-1251 тэмдэгтийн кодыг нэг нэгээр нь оруулна.
Бид туслах талбарыг үүсгэдэг - "alpha2". “=ФИНД(CHAR(Омега;1); “alpha1”;N)” томъёогоор.
Бид туслах талбарыг үүсгэдэг - "alpha3". Томьёогоор “=ХЭРЭВ(ISNUMBER(“alpha2”;N);1;0)”
"=SUM("alpha3"N1:"alpha3"N365498)" томьёотой "Омега-2" тогтмол нүдийг үүсгэ.
Хүснэгт 3. Үр дүнгийн урьдчилсан шинжилгээний үр дүн
Хүснэгт 4. Энэ үе шатанд бүртгэгдсэн алдаа
2.2.1-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t221 = 8 цаг.
2.2.1-р үе шатанд залруулсан алдааны тоо (Шуманы томъёоны хувьд) n221 = 0 ширхэг.
3 шат.
Гурав дахь алхам бол өгөгдлийн багцын төлөвийг бүртгэх явдал юм. Бид бичлэг, талбар бүрт өвөрмөц дугаар (ID) өгдөг. Энэ нь өөрчлөгдсөн өгөгдлийн багцыг эх хувилбартай харьцуулахад шаардлагатай. Мөн бүлэглэх, шүүх боломжийг бүрэн ашиглах шаардлагатай. Энд бид дахин Хүснэгт 2.2.2-т хандаад өгөгдлийн багцад ашиглагдаагүй тэмдэгтийг сонгоно. Үр дүнг Зураг 10-д үзүүлэв.

Зураг 10. Тодорхойлогчдыг оноож байна.
3-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t3 = 0,75 цаг.
3-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n3 = 0 ширхэг.
Шуманы томьёо нь энэ үе шатыг алдаа засах замаар дуусгахыг шаарддаг тул бид 2-р шат руу буцна.
2.2.2 шат.
Энэ үе шатанд бид давхар, гурав дахин зайг засах болно.

Зураг.11. Давхар зайны тоо.
Хүснэгт 2.2.4-т тодорхойлсон алдааг засах.
Хүснэгт 5. Алдаа засах үе шат

"e" эсвэл "yo" үсгийг ашиглах нь яагаад чухал болохыг харуулсан жишээг Зураг 12-т үзүүлэв.

Зураг 12. "ё" үсгийн зөрчил.
2.2.2 тайзан дээр зарцуулсан нийт хугацаа t222 = 4 цаг.
2.2.2-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n222 = 583 ширхэг.
Дөрөв дэх үе шат.
Талбайн илүүдэл байгаа эсэхийг шалгах нь энэ алхамд тохиромжтой. 44 талбараас 6 нь:
7 - Бүтцийн зорилго
16 - Газар доорх давхрын тоо
17 - Эцэг эхийн объект
21 — Тосгоны зөвлөл
38 - Бүтцийн параметрүүд (тайлбар)
40 - Соёлын өв
Тэдэнд ганц ч оролт байхгүй. Өөрөөр хэлбэл, тэд илүүдэлтэй байна.
"22 - Хот" талбар нь нэг бичилттэй, Зураг 13.

Зураг 13. “Хот” талбар дахь цорын ганц Z_348653 оруулга.
"34 - Барилгын нэр" талбарт талбарын зорилгод нийцэхгүй байгаа бичилтүүд байна, Зураг 14.

Зураг 14. Үл нийцэх бичилтийн жишээ.
Бид эдгээр талбаруудыг өгөгдлийн багцаас хасч, 214 бичлэгт өөрчлөлт оруулдаг.
4-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t4 = 2,5 цаг.
4-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n4 = 222 ширхэг.
Хүснэгт 6. 4-р шатны дараах өгөгдлийн багц үзүүлэлтүүдийн шинжилгээ

Ерөнхийдөө үзүүлэлтүүдийн өөрчлөлтөд дүн шинжилгээ хийхдээ (Хүснэгт 6) бид дараахь зүйлийг хэлж болно.
1) Тэмдгийн дундаж тоог стандарт хазайлтын хөшүүрэгтэй харьцуулсан харьцаа нь 3-тай ойролцоо байгаа нь хэвийн тархалтын шинж тэмдэг (зургаан сигма дүрэм) байна гэсэн үг юм.
2) Дундаж хөшүүргээс хамгийн бага ба хамгийн их хөшүүргийн мэдэгдэхүйц хазайлт нь сүүлийг судлах нь алдаа хайх ирээдүйтэй чиглэл болохыг харуулж байна.
Бид Шуманы аргачлалыг ашиглан алдааг олох үр дүнг шалгах болно.
Сул зогсолтын үе шатууд
2.1. 2.1-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t21 = 1 цаг.
2.1-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n21 = 0 ширхэг.
3. 3-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t3 = 0,75 цаг.
3-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n3 = 0 ширхэг.
Үр дүнтэй үе шатууд
2.2. 2.2.1-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t221 = 8 цаг.
2.2.1-р үе шатанд залруулсан алдааны тоо (Шуманы томъёоны хувьд) n221 = 0 ширхэг.
2.2.2 тайзан дээр зарцуулсан нийт хугацаа t222 = 4 цаг.
2.2.2-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n222 = 583 ширхэг.
Тайзан дээр зарцуулсан нийт хугацаа 2.2 t22 = 8 + 4 = 12 цаг.
2.2.2-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n222 = 583 ширхэг.
4. 4-р шатанд зарцуулсан нийт хугацаа (Шуманы томъёоны хувьд) t4 = 2,5 цаг.
4-р алхамд олдсон алдааны тоо (Шуманы томъёоны хувьд) n4 = 222 ширхэг.
Шуманы загварын эхний шатанд заавал оруулах ёстой 0 үе шатууд байдаг ба нөгөө талаас 2.2, 4-р үе шатууд нь үндсэндээ бие даасан байдаг тул Шуманы загвар нь туршилтын үргэлжлэх хугацаа нэмэгдэхийн хэрээр алдааг илрүүлэх магадлал буурдаг, өөрөөр хэлбэл алдаа дутагдлын урсгал буурч, дараа нь энэ үе шатыг судалсны дагуу эхлээд ямар үе шат руу шилжихийг тодорхойлох болно. Дүрэм, хаана эвдрэлийн нягтрал илүү их байвал тэр үе шатыг нэгдүгээрт тавина.
![]()
Зураг.15.
15-р зурагт үзүүлсэн томъёоноос үзэхэд тооцоололд 2.2-р шатнаас өмнө дөрөв дэх үе шатыг байрлуулах нь зүйтэй.
Шуманы томъёог ашиглан бид алдааны тооцоолсон анхны тоог тодорхойлно.

Зураг.16.
Зураг 16-д үзүүлсэн үр дүнгээс харахад алдааны таамагласан тоо N2 = 3167 буюу хамгийн бага шалгуур болох 1459-аас их байна.
Залруулгын үр дүнд бид 805 алдааг зассан бөгөөд таамагласан тоо нь 3167 - 805 = 2362 байгаа нь бидний баталсан хамгийн бага босго хэмжээнээс давсан хэвээр байна.
Бид C параметр, lambda болон найдвартай байдлын функцийг тодорхойлно.

Зураг.17.
Үндсэндээ lambda нь үе шат бүрт алдаа илрэх хурдны бодит үзүүлэлт юм. Өмнөх тооцоог харахад энэ үзүүлэлт цагт 42,4 алдаа гарсан нь Шуманны үзүүлэлттэй нэлээд дүйцэхүйц үзүүлэлт юм. Энэ материалын эхний хэсэгт дурьдсанаар хөгжүүлэгчийн алдаа илрүүлэх түвшин 250,4 бичлэг тутамд 1 алдаанаас багагүй байх ёстой бөгөөд минут тутамд нэг бичлэгийг шалгаж байх ёстой гэж тодорхойлсон. Тиймээс Шуманы загварын хувьд чухал lambda утга нь:
60/250,4 = 0,239617 байна.
Өөрөөр хэлбэл, одоо байгаа 38,964-аас 0,239617 хүртэл буурах хүртэл алдаа илрүүлэх процедурыг хийх шаардлагатай.
Эсвэл N (алдааны боломжит тоо) хасах n (алдааны залруулсан тоо) нь бидний баталсан босго хэмжээнээс доогуур буурах хүртэл (эхний хэсэгт) - 1459 ширхэг.
Эх сурвалж: www.habr.com
