Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

В առաջին մաս նկարագրված է, որ այս հրապարակումը կատարվել է Խանտի-Մանսի Ինքնավար Օկրուգում անշարժ գույքի կադաստրային գնահատման արդյունքների տվյալների բազայի հիման վրա։

Գործնական մասը ներկայացված է քայլերի տեսքով. Ամբողջ մաքրումը կատարվել է Excel-ում, քանի որ ամենատարածված գործիքը և նկարագրված գործողությունները կարող են կրկնվել Excel-ին տիրապետող մասնագետների մեծ մասի կողմից: Եվ բավականին հարմար է ձեռքի աշխատանքի համար:

Զրոյական փուլը լինելու է ֆայլը գործարկելու և պահպանելու աշխատանքը, քանի որ այն ունի 100 ՄԲ չափսեր, այնուհետև այդ գործողությունների թիվը տասնյակ և հարյուրավոր է, դրանք զգալի ժամանակ են պահանջում:
Բացումը միջինում 30 վայրկյան է։
Խնայողություն – 22 վրկ.

Առաջին փուլը սկսվում է տվյալների բազայի վիճակագրական ցուցանիշների որոշմամբ:

Աղյուսակ 1. Տվյալների հավաքածուի վիճակագրական ցուցանիշները
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

Տեխնոլոգիա 2.1.

Օժանդակ դաշտ ենք ստեղծում, ես ունեմ թվի տակ՝ ԱՅ։ Յուրաքանչյուր մուտքի համար մենք ձևավորում ենք «=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)» բանաձևը:

2.1 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t21 = 1 ժամ:
2.1 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n21 = 0 հատ:

Երկրորդ փուլ.
Տվյալների հավաքածուի բաղադրիչների ստուգում:
2.2. Գրառումների բոլոր արժեքները ձևավորվում են ստանդարտ նշանների միջոցով: Հետևաբար, եկեք հետևենք վիճակագրությանը ըստ նշանների:

Աղյուսակ 2. Տվյալների հավաքածուի նիշերի վիճակագրական ցուցանիշները՝ արդյունքների նախնական վերլուծությամբ:Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

Տեխնոլոգիա 2.2.1.

Մենք ստեղծում ենք օժանդակ դաշտ՝ «ալֆա1»: Յուրաքանչյուր գրառման համար մենք ձևավորում ենք «=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)» բանաձևը:
Մենք ստեղծում ենք ֆիքսված Omega-1 բջիջ: Այս բջիջում մենք հերթափոխով մուտքագրելու ենք նիշերի կոդերը՝ ըստ Windows-1251-ի՝ 32-ից մինչև 255:
Մենք ստեղծում ենք օժանդակ դաշտ՝ «ալֆա2»: «=FIND (SYMBOL (Omega,1); «alpha1», N)» բանաձևով:
Մենք ստեղծում ենք օժանդակ դաշտ՝ «ալֆա3»: «=IF(ISNUMBER(«alpha2»,N),1)» բանաձևով
Ստեղծեք «Օմեգա-2» ֆիքսված բջիջ՝ «=SUM(«alpha3»N1: «alpha3»N365498)» բանաձևով:

Աղյուսակ 3. Արդյունքների նախնական վերլուծության արդյունքներըՄաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

Աղյուսակ 4. Այս փուլում արձանագրված սխալներըՄաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

2.2.1 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t221 = 8 ժամ:
Ուղղված սխալների քանակը 2.2.1 փուլում (Շումանի բանաձևի համար) n221 = 0 հատ:

Քայլ 3.
Երրորդ քայլը տվյալների բազայի վիճակի գրանցումն է: Յուրաքանչյուր գրառման հատկացնելով եզակի համար (ID) և յուրաքանչյուր դաշտ: Սա անհրաժեշտ է փոխարկված տվյալների բազան սկզբնականի հետ համեմատելու համար: Սա նաև անհրաժեշտ է խմբավորման և զտման հնարավորություններից լիարժեք օգտվելու համար: Այստեղ մենք կրկին դիմում ենք աղյուսակ 2.2.2-ին և ընտրում մի նշան, որը չի օգտագործվում տվյալների հավաքածուում: Մենք ստանում ենք այն, ինչ ցույց է տրված Նկար 10-ում:

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 10. Նույնացուցիչների նշանակում:

3 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t3 = 0,75 ժամ:
3 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n3 = 0 հատ:

Քանի որ Շումանի բանաձևը պահանջում է, որ փուլն ավարտվի սխալների ուղղման միջոցով: Վերադառնանք 2-րդ փուլին։

Քայլ 2.2.2.
Այս քայլում մենք կուղղենք նաև կրկնակի և եռակի բացատները:
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 11. Կրկնակի բացատների քանակը.

Աղյուսակ 2.2.4-ում նշված սխալների ուղղում:

Աղյուսակ 5. Սխալների ուղղման փուլՄաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

Օրինակ, թե ինչու է նշանակալից «e» կամ «e» տառերի օգտագործումը, ներկայացված է Նկար 12-ում:

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 12. «է» տառի անհամապատասխանություն։

2.2.2 քայլում ծախսված ընդհանուր ժամանակը t222 = 4 ժամ:
2.2.2 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n222 = 583 հատ:

Չորրորդ փուլ.
Դաշտի ավելորդության ստուգումը լավ տեղավորվում է այս փուլում: 44 դաշտերից 6-ը.
7 - Կառույցի նպատակը
16 — Ստորգետնյա հարկերի քանակը
17 - Ծնող օբյեկտ
21 - գյուղխորհուրդ
38 — Կառուցվածքի պարամետրեր (նկարագրություն)
40 – Մշակութային ժառանգություն

Նրանք ոչ մի գրառում չունեն։ Այսինքն՝ ավելորդ են։
«22 – Քաղաք» դաշտն ունի մեկ մեկ մուտք՝ Նկար 13:

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 13. Միակ մուտքն է Z_348653 «Քաղաք» դաշտում:

«34 - Շենքի անվանում» դաշտը պարունակում է գրառումներ, որոնք ակնհայտորեն չեն համապատասխանում դաշտի նպատակին, Նկար 14:

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 14. Չհամապատասխանող մուտքի օրինակ:

Մենք բացառում ենք այս դաշտերը տվյալների հավաքածուից: Իսկ փոփոխությունն արձանագրում ենք 214 գրառումներում։

4 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t4 = 2,5 ժամ:
4 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n4 = 222 հատ:

Աղյուսակ 6. Տվյալների հավաքածուի ցուցանիշների վերլուծություն 4-րդ փուլից հետո

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական

Ընդհանուր առմամբ, վերլուծելով ցուցանիշների փոփոխությունները (Աղյուսակ 6) կարելի է ասել, որ.
1) Նշանների միջին քանակի հարաբերությունը ստանդարտ շեղման լծակին մոտ է 3-ին, այսինքն՝ կան նորմալ բաշխման նշաններ (վեց սիգմա կանոն)։
2) Նվազագույն և առավելագույն լծակների զգալի շեղումը միջին լծակից հուշում է, որ պոչերի ուսումնասիրությունը խոստումնալից ուղղություն է սխալների որոնման ժամանակ:

Քննենք Շումանի մեթոդաբանությամբ սխալներ գտնելու արդյունքները։

Անգործության փուլեր

2.1. 2.1 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t21 = 1 ժամ:
2.1 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n21 = 0 հատ:

3. 3 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t3 = 0,75 ժամ:
3 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n3 = 0 հատ:

Արդյունավետ փուլեր
2.2. 2.2.1 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t221 = 8 ժամ:
Ուղղված սխալների քանակը 2.2.1 փուլում (Շումանի բանաձևի համար) n221 = 0 հատ:
2.2.2 քայլում ծախսված ընդհանուր ժամանակը t222 = 4 ժամ:
2.2.2 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n222 = 583 հատ:

2.2 քայլում ծախսված ընդհանուր ժամանակը t22 = 8 + 4 = 12 ժամ:
2.2.2 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n222 = 583 հատ:

4. 4 բեմում անցկացրած ընդհանուր ժամանակը (Շումանի բանաձևի համար) t4 = 2,5 ժամ:
4 փուլում հայտնաբերված սխալների քանակը (Շումանի բանաձևի համար) n4 = 222 հատ:

Քանի որ կան զրոյական փուլեր, որոնք պետք է ներառվեն Շումանի մոդելի առաջին փուլում, իսկ մյուս կողմից, 2.2 և 4 փուլերը ի սկզբանե անկախ են, ապա հաշվի առնելով, որ Շումանի մոդելը ենթադրում է, որ ստուգման տևողությունը մեծացնելով, հավանականությունը. Սխալը հայտնաբերելու դեպքում նվազում է, այսինքն՝ հոսքը նվազեցնում է խափանումները, այնուհետև այս հոսքը ուսումնասիրելով մենք կորոշենք, թե որ փուլը դնել առաջինը, ըստ կանոնի, որտեղ խափանումների խտությունն ավելի հաճախ է լինում, առաջինը կդնենք այդ փուլը։

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 15.

Նկար 15-ի բանաձևից հետևում է, որ նախընտրելի է չորրորդ փուլը տեղադրել 2.2 փուլից առաջ հաշվարկներում:

Օգտագործելով Շումանի բանաձևը, մենք որոշում ենք սխալների գնահատված սկզբնական թիվը.

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 16.

Գծապատկեր 16-ի արդյունքներից երևում է, որ սխալների կանխատեսված թիվը N2 = 3167 է, որն ավելին է, քան 1459 նվազագույն չափանիշը:

Ուղղման արդյունքում մենք ուղղել ենք 805 սխալ, իսկ կանխատեսվող թիվը 3167 – 805 = 2362 է, որը դեռ ավելին է մեր ընդունած նվազագույն շեմից։

Մենք սահմանում ենք պարամետր C, lambda և հուսալիության գործառույթ.

Մաքրել տվյալները, ինչպես ռոք, թուղթ, մկրատ խաղ: Սա խաղ է ավարտով, թե առանց ավարտի: Մաս 2. Գործնական
Նկար 17.

Ըստ էության, լամբդան ինտենսիվության փաստացի ցուցանիշ է, որով սխալները հայտնաբերվում են յուրաքանչյուր փուլում: Եթե ​​նայեք վերևում, ապա այս ցուցանիշի նախորդ գնահատականը կազմում էր ժամում 42,4 սխալ, ինչը բավականին համեմատելի է Շումանի ցուցանիշի հետ: Անդրադառնալով այս նյութի առաջին մասին՝ որոշվեց, որ ծրագրավորողի կողմից սխալներ գտնելու արագությունը պետք է լինի ոչ ցածր, քան 1 սխալ 250,4 գրառումների համար՝ րոպեում 1 գրառում ստուգելիս: Այսպիսով, Լամբդայի կրիտիկական արժեքը Շումանի մոդելի համար.
60 / 250,4 = 0,239617:

Այսինքն՝ սխալների հայտնաբերման ընթացակարգերի իրականացման անհրաժեշտությունը պետք է իրականացվի այնքան ժամանակ, քանի դեռ լամբդան՝ առկա 38,964-ից, իջնի մինչև 0,239617։

Կամ այնքան ժամանակ, քանի դեռ N (սխալների պոտենցիալ քանակ) մինուս n (սխալների շտկված թիվը) ցուցիչը չիջնի մեր ընդունած շեմից (առաջին մասում)՝ 1459 հատ:

Մաս 1. Տեսական.

Source: www.habr.com

Добавить комментарий