Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

В бірінші бөлім Бұл жарияланым Ханты-Мансий автономиялық округіндегі жылжымайтын мүлікті кадастрлық бағалау нәтижелерінің деректер жинағы негізінде жасалғаны сипатталған.

Практикалық бөлім қадамдар түрінде берілген. Барлық тазалау Excel бағдарламасында жасалды, өйткені ең көп таралған құрал мен сипатталған операцияларды Excel бағдарламасын білетін мамандардың көпшілігі қайталай алады. Және қолмен жұмыс істеуге өте қолайлы.

Нөлдік кезең файлды іске қосу және сақтау жұмысы болады, өйткені оның өлшемі 100 МБ, содан кейін бұл операциялардың саны ондаған және жүздеген болса, олар көп уақытты алады.
Ашылу орта есеппен 30 секундты құрайды.
Сақтау – 22 сек.

Бірінші кезең деректер жиынтығының статистикалық көрсеткіштерін анықтаудан басталады.

Кесте 1. Деректер жиынының статистикалық көрсеткіштері
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

Технология 2.1.

Біз көмекші өрісті жасаймыз, менде ол санның астында - AY. Әрбір жазба үшін “=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)” формуласын қалыптастырамыз.

2.1-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t21 = 1 сағат.
2.1 кезеңде табылған қателер саны (Шуман формуласы үшін) n21 = 0 дана.

Екінші кезең.
Деректер жиынының құрамдастарын тексеру.
2.2. Жазбалардағы барлық мәндер стандартты белгілер арқылы қалыптасады. Сондықтан статистиканы белгілер бойынша бақылап көрейік.

Кесте 2. Нәтижелерді алдын ала талдаумен деректер жиынындағы таңбалардың статистикалық көрсеткіштері.Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

Технология 2.2.1.

Біз көмекші өрісті жасаймыз - «alpha1». Әрбір жазба үшін «=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)» формуласын құрастырамыз.
Біз бекітілген Омега-1 жасушасын жасаймыз. Бұл ұяшыққа Windows-1251-ге сәйкес 32-ден 255-ке дейінгі таңба кодтарын кезекпен енгіземіз.
Біз көмекші өрісті жасаймыз - «альфа2». “=ТАБУ(СИМВОЛ(Омега,1); “альфа1”,N)” формуласымен.
Біз көмекші өрісті жасаймыз - «alpha3». “=Егер(ISNUMBER(“alpha2”,N),1)” формуласымен
“=SUM(“alpha2”N3: “alpha1”N3)” формуласымен бекітілген “Омега-365498” ұяшығын жасаңыз.

Кесте 3. Нәтижелерді алдын ала талдау нәтижелеріТас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

Кесте 4. Осы кезеңде жазылған қателерТас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

2.2.1-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t221 = 8 сағат.
2.2.1 кезеңіндегі түзетілген қателер саны (Шуман формуласы үшін) n221 = 0 дана.

3 кезеңі.
Үшінші қадам - ​​деректер жиынының күйін жазу. Әрбір жазбаға бірегей нөмірді (ID) және әрбір өрісті тағайындау арқылы. Бұл түрлендірілген деректер жинағын түпнұсқамен салыстыру үшін қажет. Бұл топтау және сүзу мүмкіндіктерін толық пайдалану үшін де қажет. Мұнда тағы да 2.2.2 кестеге жүгінеміз және деректер жиынында пайдаланылмаған символды таңдаймыз. Біз 10-суретте көрсетілген нәрсені аламыз.

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
10-сурет. Идентификаторларды тағайындау.

3-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t3 = 0,75 сағат.
3 кезеңде табылған қателер саны (Шуман формуласы үшін) n3 = 0 дана.

Өйткені Шуман формуласы кезеңді қателерді түзету арқылы аяқтауды талап етеді. 2-кезеңге оралайық.

2.2.2 кезеңі.
Бұл қадамда біз екі және үштік бос орындарды да түзетеміз.
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
11-сурет. Қос бос орындар саны.

2.2.4 кестеде анықталған қателерді түзету.

Кесте 5. Қатені түзету кезеңіТас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

Неліктен «e» немесе «e» әріптерін пайдалану сияқты аспект маңызды екендігінің мысалы 12-суретте келтірілген.

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
12-сурет. «e» әрпіндегі сәйкессіздік.

2.2.2-қадамда жұмсалған жалпы уақыт t222 = 4 сағат.
2.2.2 кезеңде табылған қателер саны (Шуман формуласы үшін) n222 = 583 дана.

Төртінші кезең.
Өрістердің артықтығын тексеру осы кезеңге жақсы сәйкес келеді. 44 өрістің 6 өрісі:
7 - Құрылымның мақсаты
16 — Жер асты қабаттарының саны
17 - Негізгі нысан
21 - Ауылдық Кеңес
38 — Құрылым параметрлері (сипаттама)
40 – Мәдени мұра

Олардың жазбалары жоқ. Яғни, олар артық.
«22 – Қала» жолында бір жазба бар, 13-сурет.

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
13-сурет. Жалғыз жазба – «Қала» өрісінде Z_348653.

«34 - Ғимарат атауы» жолында өрістің мақсатына анық сәйкес келмейтін жазбалар бар, 14-сурет.

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
14-сурет. Сәйкес келмейтін жазбаның мысалы.

Бұл өрістерді деректер жиынынан шығарамыз. Ал өзгерісті 214 жазбаға тіркейміз.

4-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t4 = 2,5 сағат.
4 кезеңде табылған қателер саны (Шуман формуласы үшін) n4 = 222 дана.

Кесте 6. 4-кезеңнен кейінгі деректер жиынының көрсеткіштерін талдау

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық

Жалпы алғанда, көрсеткіштердің өзгеруін талдай отырып (6-кесте) мынаны айтуға болады:
1) Символдардың орташа санының стандартты ауытқу тұтқасына қатынасы 3-ке жақын, яғни қалыпты таралу белгілері бар (алты сигма ережесі).
2) Минималды және максимум рычагтардың орташа рычагтан айтарлықтай ауытқуы қателерді іздеу кезінде құйрықты зерттеу перспективалы бағыт екенін көрсетеді.

Шуман әдістемесінің көмегімен қателерді табу нәтижелерін қарастырайық.

Бос кезеңдері

2.1. 2.1-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t21 = 1 сағат.
2.1 кезеңде табылған қателер саны (Шуман формуласы үшін) n21 = 0 дана.

3. 3-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t3 = 0,75 сағат.
3 кезеңде табылған қателер саны (Шуман формуласы үшін) n3 = 0 дана.

Тиімді кезеңдері
2.2. 2.2.1-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t221 = 8 сағат.
2.2.1 кезеңіндегі түзетілген қателер саны (Шуман формуласы үшін) n221 = 0 дана.
2.2.2-қадамда жұмсалған жалпы уақыт t222 = 4 сағат.
2.2.2 кезеңде табылған қателер саны (Шуман формуласы үшін) n222 = 583 дана.

2.2-қадамда жұмсалған жалпы уақыт t22 = 8 + 4 = 12 сағат.
2.2.2 кезеңде табылған қателер саны (Шуман формуласы үшін) n222 = 583 дана.

4. 4-кезеңге жұмсалған жалпы уақыт (Шуман формуласы үшін) t4 = 2,5 сағат.
4 кезеңде табылған қателер саны (Шуман формуласы үшін) n4 = 222 дана.

Шуман моделінің бірінші сатысына қосылуы тиіс нөлдік кезеңдер болғандықтан, ал екінші жағынан, 2.2 және 4-кезеңдер өз алдына тәуелсіз, сондықтан Шуман моделі тексеру ұзақтығын ұлғайту арқылы ықтималдықты болжайтынын ескерсек. қатені анықтау азаяды, яғни ағын ақауларды азайтады, содан кейін осы ағынды зерттей отырып, біз қай кезеңді бірінші қою керектігін анықтаймыз, ережеге сәйкес бұзылу тығыздығы қай жерде жиі болса, сол кезеңді бірінші қоямыз.

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
15-сурет.

15-суреттегі формуладан төртінші кезеңді есептеулерде 2.2-кезеңге дейін орналастырған дұрыс екендігі шығады.

Шуман формуласын пайдаланып қателердің болжамды бастапқы санын анықтаймыз:

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
16-сурет.

16-суреттегі нәтижелерден қателердің болжамды саны N2 = 3167 екенін көруге болады, бұл 1459 ең төменгі критерийден артық.

Түзету нәтижесінде біз 805 қатені түзеттік, болжамды сан 3167 – 805 = 2362, бұл біз қабылдаған ең төменгі шекті мәннен әлі де жоғары.

Біз C параметрін, ламбда және сенімділік функциясын анықтаймыз:

Тас, қағаз, қайшы ойыны сияқты деректерді тазалаңыз. Бұл аяқталуы бар немесе жоқ ойын ма? 2-бөлім. Практикалық
17-сурет.

Негізінде, ламбда әр кезеңде қателер анықталатын қарқындылықтың нақты көрсеткіші болып табылады. Жоғарыда қарасаңыз, бұл көрсеткіштің бұрынғы бағасы сағатына 42,4 қатені құраған, бұл Шуман көрсеткішімен біршама салыстырмалы. Осы материалдың бірінші бөлігіне жүгінсек, әзірлеушінің қателерді табу жылдамдығы минутына 1 жазбаны тексеру кезінде 250,4 жазбаға 1 қатеден төмен болмауы керек екендігі анықталды. Демек, Шуман моделі үшін ламбданың критикалық мәні:
60 / 250,4 = 0,239617.

Яғни, қателерді анықтау процедураларын жүргізу қажеттілігі ламбда бар 38,964-тен 0,239617-ге дейін төмендегенше орындалуы керек.

Немесе N индикаторы (қателердің ықтимал саны) минус n (қателердің түзетілген саны) біз қабылдаған шекті мәннен төмендегенше (бірінші бөлімде) - 1459 дана.

1-бөлім. Теориялық.

Ақпарат көзі: www.habr.com

пікір қалдыру