ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

В لومړۍ برخه دا تشریح شوي چې دا خپرونه د خنټي مانسي خودمختاره اوکروګ کې د املاکو د کاډسټرال ارزښت پایلو د ډیټا سیټ پراساس رامینځته شوې.

عملي برخه د ګامونو په بڼه وړاندې کیږي. ټول پاکول په Excel کې ترسره شوي، ځکه چې خورا عام وسیله او تشریح شوي عملیات د ډیری متخصصینو لخوا تکرار کیدی شي چې په Excel پوهیږي. او د لاسي کار لپاره خورا مناسب.

د صفر مرحله به د فایل لانچ او خوندي کولو کار وي، ځکه چې دا د 100 MB اندازه ده، نو د دې عملیاتو شمیر په لسګونو او سلګونو وي، دوی د پام وړ وخت نیسي.
پرانیستل، په اوسط ډول، 30 ثانیې دي.
خوندي کول - 22 ثانیې.

لومړۍ مرحله د ډیټاسیټ احصایوي شاخصونو په ټاکلو سره پیل کیږي.

جدول 1. د ډیټا سیټ احصایوي شاخصونه
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

ټیکنالوژي 2.1.

موږ یو مرستندویه ساحه رامینځته کوو، زه دا د شمیرې لاندې لرم - AY. د هرې ننوتلو لپاره، موږ فورمول جوړوو "=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)"

ټول وخت په مرحله 2.1 کې مصرف شوی (د شومن فارمول لپاره) t21 = 1 ساعت.
په مرحله 2.1 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n21 = 0 پی سیز.

دوهم پړاو.
د ډیټاسیټ اجزا چیک کول.
2.2. په ریکارډونو کې ټول ارزښتونه د معیاري سمبولونو په کارولو سره رامینځته کیږي. نو راځئ چې د سمبولونو په واسطه احصایې تعقیب کړو.

جدول 2. د پایلو لومړني تحلیل سره په ډیټا سیټ کې د کرکټرونو احصایوي شاخصونه.ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

ټیکنالوژي 2.2.1.

موږ یو معاون ساحه جوړوو - "alpha1". د هر ریکارډ لپاره، موږ فورمول جوړوو "=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)"
موږ یو ثابت اومیګا - 1 حجره رامینځته کوو. موږ به په بدیل سره د وینډوز 1251 مطابق د 32 څخه تر 255 پورې دې حجرې ته د کرکټر کوډونه داخل کړو.
موږ یو مرستندویه ساحه جوړوو - "alpha2". د فورمول سره “=FIND(SYMBOL(Omega,1);”alpha1”,N)”.
موږ یو مرستندویه ساحه جوړوو - "alpha3". د فورمول سره “=IF(ISNUMBER(“alpha2”,N),1)”
د "=SUM("alpha2"N3: "alpha1"N3) فارمول سره یو ثابت سیل "Omega-365498" جوړ کړئ.

جدول 3. د پایلو د لومړنیو تحلیلونو پایلېډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

جدول 4. په دې مرحله کې ثبت شوي تېروتنېډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

ټول وخت په مرحله 2.2.1 کې مصرف شوی (د شومن فارمول لپاره) t221 = 8 ساعت.
په مرحله 2.2.1 کې د سمو غلطیو شمیر (د شومن فارمول لپاره) n221 = 0 پی سیز.

سټیج 3.
دریم ګام د ډیټاسیټ حالت ثبتول دي. د هر ریکارډ په ټاکلو سره یو ځانګړی شمیر (ID) او هر ساحه. دا اړینه ده چې بدل شوي ډیټاسیټ د اصلي سره پرتله کړئ. دا هم اړینه ده چې د ګروپ کولو او فلټر کولو وړتیاو څخه بشپړه ګټه پورته کړئ. دلته بیا موږ 2.2.2 جدول ته مخه کوو او یو سمبول غوره کوو چې په ډیټاسیټ کې نه کارول کیږي. موږ هغه څه ترلاسه کوو چې په 10 شکل کې ښودل شوي.

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 10. د پیژندونکو ټاکل.

ټول وخت په مرحله 3 کې مصرف شوی (د شومن فارمول لپاره) t3 = 0,75 ساعت.
په مرحله 3 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n3 = 0 پی سیز.

ځکه چې د شومن فارمول اړتیا لري چې مرحله د غلطیو په سمولو سره بشپړه شي. راځئ چې 2 مرحلې ته راستون شو.

سټیج 2.2.2.
پدې مرحله کې به موږ دوه ځله او درې ځله ځایونه هم سم کړو.
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 11. د دوه ګونی ځایونو شمیر.

په جدول 2.2.4 کې د پیژندل شویو غلطیو سمون.

جدول 5. د تېروتنې د سمون مرحلهډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

یوه بیلګه چې ولې دا ډول اړخ لکه د "e" یا "e" لیکونو کارول مهم دي په 12 شکل کې وړاندې کیږي.

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 12. په "e" لیک کې توپیر.

ټول وخت په 2.2.2 مرحله کې مصرف شوی t222 = 4 ساعته.
په مرحله 2.2.2 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n222 = 583 پی سیز.

څلورم پړاو.
د ساحې د بې ځایه کیدو لپاره چک کول پدې مرحله کې ښه فټ کیږي. د 44 ساحو څخه، 6 ساحې:
۷ – د جوړښت موخه
16 - د ځمکې لاندې پوړونو شمیر
۱۷ – د پلار څیز
۲۱ – د کلیو شورا
38 - د جوړښت پیرامیټونه (تفصیل)
۴۰ – فرهنګي میراث

دوی هیڅ داخله نلري. دا، دوی بې ځایه دي.
ساحه "22 - ښار" یو واحد ننوتل لري، شکل 13.

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 13. یوازینۍ ننوتل د "ښار" په ساحه کې Z_348653 دی.

ساحه "34 - د ودانۍ نوم" هغه داخلې لري چې په ښکاره ډول د ساحې هدف سره مطابقت نلري، شکل 14.

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 14. د غیر مطابقت لرونکي ننوتلو یوه بیلګه.

موږ دا ساحې د ډیټا سیټ څخه لرې کوو. او موږ په 214 ریکارډونو کې بدلون ثبتوو.

ټول وخت په مرحله 4 کې مصرف شوی (د شومن فارمول لپاره) t4 = 2,5 ساعت.
په مرحله 4 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n4 = 222 پی سیز.

جدول 6. د څلورمې مرحلې څخه وروسته د ډیټا ټاکلو شاخصونو تحلیل

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي

په عمومي توګه، په شاخصونو کې د بدلونونو تحلیل (6 جدول) موږ کولی شو ووایو چې:
1) د معیاري انحراف لیور ته د سمبولونو اوسط شمیر تناسب 3 ته نږدې دی ، دا د نورمال توزیع نښې شتون لري (شپږ سیګما قاعده).
2) د اوسط لیور څخه د لږترلږه او اعظمي لیورونو د پام وړ انحراف وړاندیز کوي چې د خطونو مطالعه د تیروتنې په لټه کې یو امید لرونکی اړخ دی.

راځئ چې د شومن میتودولوژي په کارولو سره د غلطیو موندلو پایلې معاینه کړو.

بې کاره پړاوونه

2.1. ټول وخت په مرحله 2.1 کې مصرف شوی (د شومن فارمول لپاره) t21 = 1 ساعت.
په مرحله 2.1 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n21 = 0 پی سیز.

3. ټول وخت په مرحله 3 کې مصرف شوی (د شومن فارمول لپاره) t3 = 0,75 ساعت.
په مرحله 3 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n3 = 0 پی سیز.

اغیزمن پړاوونه
2.2. ټول وخت په مرحله 2.2.1 کې مصرف شوی (د شومن فارمول لپاره) t221 = 8 ساعت.
په مرحله 2.2.1 کې د سمو غلطیو شمیر (د شومن فارمول لپاره) n221 = 0 پی سیز.
ټول وخت په 2.2.2 مرحله کې مصرف شوی t222 = 4 ساعته.
په مرحله 2.2.2 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n222 = 583 پی سیز.

ټول وخت په 2.2 مرحله کې مصرف شوی t22 = 8 + 4 = 12 ساعته.
په مرحله 2.2.2 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n222 = 583 پی سیز.

4. ټول وخت په مرحله 4 کې مصرف شوی (د شومن فارمول لپاره) t4 = 2,5 ساعت.
په مرحله 4 کې موندل شوي د غلطیو شمیر (د شومن فارمول لپاره) n4 = 222 پی سیز.

څرنګه چې صفر مرحلې شتون لري چې باید د شومن ماډل په لومړي مرحله کې شاملې شي، او له بلې خوا، مرحلې 2.2 او 4 په طبیعي توګه خپلواک دي، نو د دې لپاره چې د شومن ماډل فرض کوي چې د چک د مودې په زیاتولو سره، احتمال د یوې تېروتنې په موندلو کې کموالی راځي، یعني جریان کمیږي ناکامي، بیا د دې جریان په معاینه کولو سره موږ به معلومه کړو چې کوم مرحله باید لومړی واچول شي، د قاعدې له مخې، چیرې چې د ناکامۍ کثافت ډیر وي، موږ به هغه مرحله لومړی ونیسو.

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 15.

په 15 شکل کې د فورمول څخه دا تعقیبوي چې دا غوره ده چې څلورم پړاو مخکې له 2.2 مرحلې په محاسبه کې ځای په ځای کړئ.

د شومن فارمول په کارولو سره، موږ د غلطیو اټکل شوي ابتدايي شمیره ټاکو:

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 16.

په 16 شکل کې د پایلو څخه دا لیدل کیدی شي چې د تیروتنې اټکل شوی شمیر N2 = 3167 دی، کوم چې د 1459 لږترلږه معیار څخه ډیر دی.

د سمون په پایله کې، موږ 805 غلطۍ سمې کړې، او وړاندوینه شوې شمیره 3167 - 805 = 2362 ده، کوم چې لاهم د لږترلږه حد څخه ډیر دی چې موږ یې منل.

موږ پیرامیټر C، لامبدا او د اعتبار فعالیت تعریف کوو:

ډاټا پاک کړئ لکه د راک، کاغذ، کینچی لوبې. ایا دا د پای سره یا پرته لوبه ده؟ 2 برخه. عملي
انځور 17.

په لازمي ډول ، لامبدا د شدت یو ریښتینی شاخص دی چې په هر مرحله کې یې غلطۍ موندل کیږي. که تاسو پورته وګورئ، د دې شاخص پخوانی اټکل په هر ساعت کې 42,4 غلطۍ وې، کوم چې د شومن شاخص سره د پرتله کولو وړ دی. د دې موادو لومړۍ برخې ته په کتلو سره، دا معلومه شوه چې هغه نرخ چې یو پرمخ وړونکي غلطی ومومي باید په هر 1 ریکارډونو کې د 250,4 غلطی څخه کم نه وي، کله چې په یوه دقیقه کې 1 ریکارډ چک کوي. له همدې امله د شومن ماډل لپاره د لامبډا مهم ارزښت:
60 / 250,4 = 0,239617.

دا دی، د غلطۍ موندلو پروسیجرونو ترسره کولو اړتیا باید تر هغه وخته پورې ترسره شي چې لامبډا، د موجوده 38,964 څخه، 0,239617 ته راټیټ شي.

یا تر هغه چې شاخص N (د خطا احتمالي شمیر) منفي n (د غلطیو سمه شمیره) د هغه حد څخه ښکته راټیټ شي چې موږ یې ومنل (په لومړۍ برخه کې) - 1459 پی سیز.

برخه 1. نظري.

سرچینه: www.habr.com

Add a comment