రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

В ప్రథమ భాగము ఖాంటీ-మాన్సీ అటానమస్ ఓక్రగ్‌లోని రియల్ ఎస్టేట్ యొక్క కాడాస్ట్రల్ వాల్యుయేషన్ ఫలితాల డేటాసెట్ ఆధారంగా ఈ ప్రచురణ రూపొందించబడిందని వివరించబడింది.

ఆచరణాత్మక భాగం దశల రూపంలో ప్రదర్శించబడుతుంది. అత్యంత సాధారణ సాధనం మరియు వివరించిన కార్యకలాపాలను ఎక్సెల్ తెలిసిన చాలా మంది నిపుణులు పునరావృతం చేయవచ్చు కాబట్టి, అన్ని శుభ్రపరచడం Excelలో జరిగింది. మరియు చేతితో పని చేయడానికి బాగా సరిపోతుంది.

సున్నా దశ ఫైల్‌ను ప్రారంభించడం మరియు సేవ్ చేయడం వంటి పని అవుతుంది, ఎందుకంటే ఇది 100 MB పరిమాణంలో ఉంటుంది, అప్పుడు ఈ కార్యకలాపాల సంఖ్య పదుల మరియు వందల సంఖ్యతో, అవి గణనీయమైన సమయాన్ని తీసుకుంటాయి.
తెరవడం, సగటున, 30 సెకన్లు.
పొదుపు - 22 సెకన్లు.

మొదటి దశ డేటాసెట్ యొక్క గణాంక సూచికలను నిర్ణయించడంతో ప్రారంభమవుతుంది.

టేబుల్ 1. డేటాసెట్ యొక్క గణాంక సూచికలు
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

సాంకేతికత 2.1.

మేము సహాయక ఫీల్డ్‌ను సృష్టిస్తాము, నేను దానిని సంఖ్య క్రింద కలిగి ఉన్నాను - AY. ప్రతి ఎంట్రీ కోసం, మేము “=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)” ఫార్ములాని రూపొందిస్తాము.

స్టేజ్ 2.1 (షూమాన్ ఫార్ములా కోసం) t21 = 1 గంటలో గడిపిన మొత్తం సమయం.
దశ 2.1 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n21 = 0 pcs.

రెండవ దశ.
డేటాసెట్ యొక్క భాగాలను తనిఖీ చేస్తోంది.
2.2 రికార్డులలోని అన్ని విలువలు ప్రామాణిక చిహ్నాలను ఉపయోగించి ఏర్పడతాయి. కాబట్టి, చిహ్నాల ద్వారా గణాంకాలను ట్రాక్ చేద్దాం.

టేబుల్ 2. ఫలితాల ప్రాథమిక విశ్లేషణతో డేటాసెట్‌లోని అక్షరాల గణాంక సూచికలు.రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

సాంకేతికత 2.2.1.

మేము సహాయక ఫీల్డ్‌ను సృష్టిస్తాము - “alpha1”. ప్రతి రికార్డ్ కోసం, మేము “=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)” ఫార్ములాని రూపొందిస్తాము.
మేము స్థిర ఒమేగా -1 సెల్‌ను సృష్టిస్తాము. మేము ఈ సెల్‌లో 1251 నుండి 32 వరకు Windows-255 ప్రకారం అక్షర కోడ్‌లను ప్రత్యామ్నాయంగా నమోదు చేస్తాము.
మేము సహాయక ఫీల్డ్‌ను సృష్టిస్తాము - “alpha2”. “=FIND(SYMBOL(Omega,1); “alpha1”,N)” ఫార్ములాతో.
మేము సహాయక ఫీల్డ్‌ను సృష్టిస్తాము - “alpha3”. ఫార్ములాతో “=IF(ISNUMBER(“alpha2”,N),1)”
“=SUM(“alpha2”N3: “alpha1”N3)” ఫార్ములాతో “Omega-365498” స్థిర సెల్‌ను సృష్టించండి

టేబుల్ 3. ఫలితాల ప్రాథమిక విశ్లేషణ ఫలితాలురాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

టేబుల్ 4. ఈ దశలో నమోదు చేయబడిన లోపాలురాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

స్టేజ్ 2.2.1 (షూమాన్ ఫార్ములా కోసం) t221 = 8 గంటలో గడిపిన మొత్తం సమయం.
దశ 2.2.1 వద్ద సరిదిద్దబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n221 = 0 pcs.

దశ 3.
మూడవ దశ డేటాసెట్ యొక్క స్థితిని రికార్డ్ చేయడం. ప్రతి రికార్డ్‌కు ఒక ప్రత్యేక సంఖ్య (ID) మరియు ప్రతి ఫీల్డ్‌ను కేటాయించడం ద్వారా. మార్చబడిన డేటాసెట్‌ను అసలు దానితో పోల్చడానికి ఇది అవసరం. గ్రూపింగ్ మరియు ఫిల్టరింగ్ సామర్థ్యాల పూర్తి ప్రయోజనాన్ని పొందడానికి ఇది కూడా అవసరం. ఇక్కడ మళ్ళీ మనం టేబుల్ 2.2.2కి మారి, డేటాసెట్‌లో ఉపయోగించని చిహ్నాన్ని ఎంచుకుంటాము. మేము మూర్తి 10 లో చూపిన వాటిని పొందుతాము.

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
అత్తి 10. ఐడెంటిఫైయర్‌లను కేటాయించడం.

స్టేజ్ 3 (షూమాన్ ఫార్ములా కోసం) t3 = 0,75 గంటలో గడిపిన మొత్తం సమయం.
దశ 3 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n3 = 0 pcs.

షూమాన్ సూత్రం ప్రకారం లోపాలను సరిదిద్దడం ద్వారా దశను పూర్తి చేయడం అవసరం కాబట్టి. దశ 2కి తిరిగి వెళ్దాం.

దశ 2.2.2.
ఈ దశలో మేము డబుల్ మరియు ట్రిపుల్ ఖాళీలను కూడా సరిచేస్తాము.
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
అత్తి 11. డబుల్ ఖాళీల సంఖ్య.

టేబుల్ 2.2.4లో గుర్తించబడిన లోపాల దిద్దుబాటు.

టేబుల్ 5. లోపం దిద్దుబాటు దశరాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

"ఇ" లేదా "ఇ" అక్షరాలను ఉపయోగించడం వంటి అంశం ఎందుకు ముఖ్యమైనది అనేదానికి ఉదాహరణ మూర్తి 12లో ప్రదర్శించబడింది.

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
అత్తి 12. "e" అక్షరంలో వ్యత్యాసం.

2.2.2 t222 = 4 గంటలలో గడిపిన మొత్తం సమయం.
దశ 2.2.2 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n222 = 583 pcs.

నాల్గవ దశ.
ఫీల్డ్ రిడెండెన్సీ కోసం తనిఖీ చేయడం ఈ దశకు బాగా సరిపోతుంది. 44 ఫీల్డ్‌లలో, 6 ఫీల్డ్‌లు:
7 - నిర్మాణం యొక్క ఉద్దేశ్యం
16 - భూగర్భ అంతస్తుల సంఖ్య
17 - మాతృ వస్తువు
21 - గ్రామ సభ
38 — నిర్మాణ పారామితులు (వివరణ)
40 - సాంస్కృతిక వారసత్వం

వారికి ఎలాంటి ఎంట్రీలు లేవు. అంటే, అవి అనవసరమైనవి.
ఫీల్డ్ “22 – సిటీ”లో ఒక సింగిల్ ఎంట్రీ ఉంది, మూర్తి 13.

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
అత్తి 13. "సిటీ" ఫీల్డ్‌లో Z_348653 మాత్రమే నమోదు.

ఫీల్డ్ “34 - బిల్డింగ్ పేరు” ఫీల్డ్ యొక్క ఉద్దేశ్యానికి స్పష్టంగా అనుగుణంగా లేని ఎంట్రీలను కలిగి ఉంది, మూర్తి 14.

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
అత్తి 14. నాన్-కంప్లైంట్ ఎంట్రీకి ఉదాహరణ.

మేము ఈ ఫీల్డ్‌లను డేటాసెట్ నుండి మినహాయిస్తాము. మరియు మేము 214 రికార్డులలో మార్పును నమోదు చేస్తాము.

స్టేజ్ 4 (షూమాన్ ఫార్ములా కోసం) t4 = 2,5 గంటలో గడిపిన మొత్తం సమయం.
దశ 4 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n4 = 222 pcs.

టేబుల్ 6. 4వ దశ తర్వాత డేటా సెట్ సూచికల విశ్లేషణ

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్

సాధారణంగా, సూచికలలో మార్పులను విశ్లేషించడం (టేబుల్ 6) మనం ఇలా చెప్పవచ్చు:
1) ప్రామాణిక విచలనం లివర్‌కు సగటు సంఖ్యల సంఖ్య నిష్పత్తి 3కి దగ్గరగా ఉంటుంది, అంటే సాధారణ పంపిణీ సంకేతాలు ఉన్నాయి (సిక్స్ సిగ్మా నియమం).
2) సగటు లివర్ నుండి కనిష్ట మరియు గరిష్ట లివర్ల యొక్క ముఖ్యమైన విచలనం లోపాల కోసం శోధిస్తున్నప్పుడు తోకల అధ్యయనం ఒక మంచి దిశ అని సూచిస్తుంది.

షూమాన్ యొక్క పద్దతిని ఉపయోగించి లోపాలను కనుగొనే ఫలితాలను పరిశీలిద్దాం.

నిష్క్రియ దశలు

2.1 స్టేజ్ 2.1లో గడిపిన మొత్తం సమయం (షుమన్ ఫార్ములా కోసం) t21 = 1 గంట.
దశ 2.1 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n21 = 0 pcs.

3 స్టేజ్ 3లో గడిపిన మొత్తం సమయం (షుమన్ ఫార్ములా కోసం) t3 = 0,75 గంట.
దశ 3 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n3 = 0 pcs.

ప్రభావవంతమైన దశలు
2.2 స్టేజ్ 2.2.1లో గడిపిన మొత్తం సమయం (షుమన్ ఫార్ములా కోసం) t221 = 8 గంట.
దశ 2.2.1 వద్ద సరిదిద్దబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n221 = 0 pcs.
2.2.2 t222 = 4 గంటలలో గడిపిన మొత్తం సమయం.
దశ 2.2.2 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n222 = 583 pcs.

2.2 t22 = 8 + 4 = 12 గంటలలో గడిపిన మొత్తం సమయం.
దశ 2.2.2 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n222 = 583 pcs.

4 స్టేజ్ 4లో గడిపిన మొత్తం సమయం (షుమన్ ఫార్ములా కోసం) t4 = 2,5 గంట.
దశ 4 వద్ద కనుగొనబడిన లోపాల సంఖ్య (షూమాన్ ఫార్ములా కోసం) n4 = 222 pcs.

షూమాన్ మోడల్ యొక్క మొదటి దశలో తప్పనిసరిగా చేర్చవలసిన సున్నా దశలు ఉన్నాయి మరియు మరోవైపు, 2.2 మరియు 4 దశలు స్వాభావికంగా స్వతంత్రంగా ఉంటాయి, అప్పుడు షూమాన్ మోడల్ చెక్ యొక్క వ్యవధిని పెంచడం ద్వారా సంభావ్యతను అంచనా వేస్తుంది లోపాన్ని గుర్తించడం తగ్గుతుంది, అనగా, ప్రవాహం వైఫల్యాలను తగ్గిస్తుంది, ఈ ప్రవాహాన్ని పరిశీలించడం ద్వారా మేము ఏ దశను మొదట ఉంచాలో నిర్ణయిస్తాము, నియమం ప్రకారం, వైఫల్యం సాంద్రత ఎక్కువగా ఉండే చోట, మేము ఆ దశను మొదట ఉంచుతాము.

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
Fig. 15.

ఫిగర్ 15లోని ఫార్ములా నుండి గణనలలో దశ 2.2 కంటే ముందు నాల్గవ దశను ఉంచడం ఉత్తమం అని అనుసరిస్తుంది.

షూమాన్ సూత్రాన్ని ఉపయోగించి, మేము అంచనా వేసిన ప్రారంభ లోపాల సంఖ్యను నిర్ణయిస్తాము:

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
Fig. 16.

మూర్తి 16లోని ఫలితాల నుండి ఊహించిన లోపాల సంఖ్య N2 = 3167 అని చూడవచ్చు, ఇది కనీస ప్రమాణం 1459 కంటే ఎక్కువ.

దిద్దుబాటు ఫలితంగా, మేము 805 లోపాలను సరిదిద్దాము మరియు అంచనా వేసిన సంఖ్య 3167 – 805 = 2362, ఇది మేము ఆమోదించిన కనీస థ్రెషోల్డ్ కంటే ఇంకా ఎక్కువ.

మేము పరామితి C, లాంబ్డా మరియు విశ్వసనీయత ఫంక్షన్‌ను నిర్వచించాము:

రాక్, పేపర్, సిజర్స్ గేమ్ వంటి డేటాను క్లీన్ అప్ చేయండి. ఇది ముగింపుతో లేదా ముగింపు లేని ఆటనా? పార్ట్ 2. ప్రాక్టికల్
Fig. 17.

ముఖ్యంగా, లాంబ్డా అనేది ప్రతి దశలో లోపాలు కనుగొనబడే తీవ్రత యొక్క వాస్తవ సూచిక. మీరు పైన చూస్తే, ఈ సూచిక యొక్క మునుపటి అంచనా గంటకు 42,4 లోపాలు, ఇది షూమాన్ సూచికతో పోల్చదగినది. ఈ మెటీరియల్‌లోని మొదటి భాగాన్ని పరిశీలిస్తే, నిమిషానికి 1 రికార్డ్‌ని తనిఖీ చేస్తున్నప్పుడు డెవలపర్ లోపాలను కనుగొనే రేటు 250,4 రికార్డ్‌లకు 1 లోపం కంటే తక్కువగా ఉండకూడదని నిర్ణయించబడింది. అందువల్ల షూమాన్ మోడల్ కోసం లాంబ్డా యొక్క క్లిష్టమైన విలువ:
60 / 250,4 = 0,239617.

అంటే, లాంబ్డా ఇప్పటికే ఉన్న 38,964 నుండి 0,239617కి తగ్గే వరకు లోపాన్ని గుర్తించే విధానాలను నిర్వహించాల్సిన అవసరం ఉంది.

లేదా సూచిక N (తప్పుల సంభావ్య సంఖ్య) మైనస్ n (తప్పుల సంఖ్య సరిదిద్దబడింది) మేము ఆమోదించిన థ్రెషోల్డ్ (మొదటి భాగంలో) కంటే తగ్గే వరకు - 1459 pcs.

పార్ట్ 1. సైద్ధాంతిక.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి