В دا تشریح شوې وه چې دا خپرونه د خنتي-مانسي خودمختاره اوکروګ کې د املاکو د کادسټرال ارزښت د پایلو د ډیټاسیټ پر بنسټ جوړه شوې وه.
عملي برخه په مرحلو کې وړاندې کیږي. ټول پاکول په ایکسل کې ترسره شوي، ځکه چې دا ترټولو عام وسیله ده او تشریح شوي عملیات د ډیری مسلکي کسانو لخوا تکرار کیدی شي چې د ایکسل سره بلد دي. دا د عملي کار لپاره هم خورا مناسب دی.
زه به د فایل د پیل او خوندي کولو کار د صفر مرحلې په توګه وساتم، ځکه چې دا د 100 MB اندازه ده، او د لسګونو او سلګونو دې عملیاتو سره، دوی د پام وړ وخت نیسي.
د پرانیستلو وخت په اوسط ډول 30 ثانیې دی.
د وخت سپمول: ۲۲ ثانیې.
لومړی پړاو د ډیټاسیټ د احصایوي شاخصونو تعریف کولو سره پیل کیږي.
جدول ۱. د ډیټاسیټ احصایوي شاخصونه

ټیکنالوژي ۲.۱.
یو مرستندویه ساحه جوړه کړئ؛ زه به ورته AY ووایم. د هر ریکارډ لپاره، فورمول "=LEN(F365502)+LEN(G365502)+…+LEN(AW365502)" جوړ کړئ.
په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t2.1 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
دوهم پړاو.
د ډیټاسیټ اجزاو چک کول.
۲.۲. په ریکارډونو کې ټول ارزښتونه د معیاري سمبولونو په کارولو سره جوړ شوي دي. له همدې امله، راځئ چې د سمبول له مخې احصایې تعقیب کړو.
جدول ۲. د پایلو د لومړني تحلیل سره په ډیټاسیټ کې د سمبولونو احصایوي شاخصونه.




ټیکنالوژي ۲.۱.
موږ یو مرستندویه ساحه جوړوو - "alpha1". د هر ریکارډ لپاره، موږ فورمول "=CONCATENATE(Sheet1!B9;…Sheet1!AQ9)" جوړوو.
موږ به یو ثابت حجره جوړه کړو چې "اومیګا-۱" نومیږي. موږ به د وینډوز-۱۲۵۱ د کرکټر کوډونه له ۳۲ څخه تر ۲۵۵ پورې په دې حجره کې یو په یو داخل کړو.
موږ یو مرستندویه ساحه جوړوو - "alpha2". د "=FIND(CHAR(Omega;1); "alpha1";N)" فورمول سره.
موږ یو مرستندویه ساحه جوړوو - "alpha3". د "=IF(ISNUMBER("alpha2";N);1;0)" فورمول سره.
د "=SUM("alpha3"N1:"alpha3"N365498)" فورمول سره یو ثابت حجره "اومیګا-2" جوړه کړئ.
جدول ۳. د پایلو د لومړني تحلیل پایلې
جدول ۴. په دې مرحله کې ثبت شوي تېروتنې
په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t2.2.1 = ۱ ساعت.
د هغو غلطیو شمیر چې په مرحله 2.2.1 کې اصلاح شوي (د شومن فورمول لپاره) n221 = 0 پی سیز.
سټیج 3.
دریم ګام د ډیټاسیټ حالت ثبتول دي. موږ هر ریکارډ او هرې ساحې ته یو ځانګړی شمیره (ID) ورکوو. دا د اصلي سره د بدل شوي ډیټاسیټ پرتله کولو لپاره اړین دی. دا هم اړینه ده چې د ګروپ کولو او فلټر کولو وړتیاو څخه په بشپړ ډول کار واخیستل شي. دلته، موږ بیا جدول 2.2.2 ته مراجعه کوو او یو سمبول غوره کوو چې په ډیټاسیټ کې نه کارول کیږي. پایله په شکل 10 کې ښودل شوې.

شکل ۱۰. د پیژندونکو ټاکل.
په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t3 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
څرنګه چې د شومن فورمول اړتیا لري چې دا مرحله د غلطۍ اصلاح سره بشپړه شي، موږ بیرته دوهم پړاو ته راستون شو.
سټیج 2.2.2.
پدې مرحله کې به موږ دوه ګونی او درې ګونی ځایونه هم سم کړو.

شکل ۱۱. د دوه ګوني ځایونو شمیر.
په جدول 2.2.4 کې د پیژندل شویو غلطیو اصلاح.
جدول ۵. د تېروتنې د اصلاح مرحله

د "e" یا "yo" تورو د کارولو په څیر د دې اړخ د اهمیت یوه بیلګه په شکل 12 کې ښودل شوې ده.

شکل ۱۲. په "ё" توري کې ناانډولي.
په مرحله 2.2.2 t222 کې ټول مصرف شوی وخت = 4 ساعته.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
څلورم پړاو.
د ساحې د بې ځایه کیدو لپاره چک کول پدې مرحله کې ښه مناسب دي. د 44 ساحو څخه، 6 دا دي:
۷ — د جوړښت موخه
۱۶ - د ځمکې لاندې پوړونو شمیر
۱۷ — اصلي څیز
۲۱ — د کلي شورا
۳۸ — د جوړښت پیرامیټرې (تفصیل)
۴۰ - کلتوري میراث
دوی یوه داخله هم نلري. دا ده، دوی بې ګټې دي.
ساحه "۲۲ - ښار" یوه واحده داخله لري، شکل ۱۳.

شکل ۱۳. د "ښار" په ساحه کې یوازینۍ داخله Z_348653 ده.
ساحه "۳۴ — د ودانۍ نوم" هغه داخلې لري چې په څرګنده توګه د ساحې هدف سره سمون نه لري، شکل ۱۴.

شکل ۱۴. د نه مطابقت لرونکې ننوتلو مثال.
موږ دا ساحې له ډیټاسیټ څخه لرې کوو او بدلونونه په 214 ریکارډونو کې ثبتوو.
په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t4 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
جدول ۶. د څلورم پړاو وروسته د ډیټاسیټ شاخصونو تحلیل

په عمومي توګه، د شاخصونو د بدلونونو تحلیل (جدول 6)، موږ کولی شو ووایو چې:
۱) د معیاري انحراف لیور سره د سمبولونو د اوسط شمیر تناسب نږدې ۳ ته دی، پدې معنی چې د نورمال ویش نښې شتون لري (شپږ سیګما قاعده).
۲) د اوسط لیور څخه د لږترلږه او اعظمي لیورونو د پام وړ انحراف وړاندیز کوي چې د لکۍ مطالعه د غلطیو په لټه کې یو امید ورکوونکی لار ده.
موږ به د شومن د میتودولوژي په کارولو سره د غلطیو موندلو پایلې وڅیړو.
بې کاره مرحلې
۲.۱. په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t2.1 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
۲.۱. په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t3 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
اغیزمن پړاوونه
۲.۱. په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t2.2 = ۱ ساعت.
د هغو غلطیو شمیر چې په مرحله 2.2.1 کې اصلاح شوي (د شومن فورمول لپاره) n221 = 0 پی سیز.
په مرحله 2.2.2 t222 کې ټول مصرف شوی وخت = 4 ساعته.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
په ۲.۲ پړاو کې ټول مصرف شوی وخت t2.2 = ۸ + ۴ = ۱۲ ساعته.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
۲.۱. په ۲.۱ پړاو کې ټول مصرف شوی وخت (د شومن فورمول لپاره) t4 = ۱ ساعت.
په ۲.۱ ګام کې موندل شوي غلطیو شمیر (د شومن فورمول لپاره) n۲۱ = ۰ ټوټې.
څرنګه چې د شومن ماډل په لومړي پړاو کې صفر مرحلې شتون لري چې باید شاملې شي، او له بلې خوا، مرحلې 2.2 او 4 په اصل کې خپلواکې دي، نو په پام کې نیولو سره چې د شومن ماډل فرض کوي چې د ازموینې د مودې په زیاتوالي سره، د غلطۍ کشف کولو احتمال کمیږي، دا دی، د ناکامیو جریان کمیږي، نو د دې جریان په مطالعه کولو سره به موږ معلومه کړو چې کوم مرحلې لومړی ځای په ځای کړو، د قاعدې سره سم، چیرې چې د ناکامۍ کثافت ډیر ځله وي، هغه مرحله لومړی ځای په ځای کیږي.
![]()
انځور 15.
د شکل ۱۵ فورمول څخه دا په ډاګه کیږي چې غوره ده چې څلورم پړاو د ۲.۲ مرحلې څخه مخکې په محاسبه کې ځای په ځای شي.
د شومن فورمول په کارولو سره، موږ د غلطیو اټکل شوي لومړني شمیر ټاکو:

انځور 16.
د ۱۶ شکل له پایلو څخه، دا لیدل کیدی شي چې د غلطیو اټکل شوی شمیر N2 = ۳۱۶۷ دی، کوم چې د ۱۴۵۹ لږترلږه معیار څخه لوی دی.
د سمون په پایله کې، موږ ۸۰۵ غلطۍ سمې کړې، او وړاندوینه شوې شمیره ۳۱۶۷ - ۸۰۵ = ۲۳۶۲ ده، کوم چې لاهم د هغه لږترلږه حد څخه ډیر دی چې موږ یې منلی دی.
موږ د C پیرامیټر، لامبډا او د اعتبار فعالیت تعریفوو:

انځور 17.
په اصل کې، لامبډا د هغه نرخ یو ریښتینی شاخص دی چې په هره مرحله کې د غلطیو کشف کیږي. د مخکیني اټکل په لټه کې، دا شاخص په ساعت کې 42,4 غلطۍ وې، کوم چې د شومان شاخص سره خورا پرتله کیدونکی دی. د دې موادو لومړۍ برخې ته په اشارې سره، دا معلومه شوه چې د پراختیا کونکي د غلطۍ کشف کچه باید په هر 250,4 ریکارډونو کې له 1 غلطۍ څخه کمه نه وي، په هره دقیقه کې یو ریکارډ چیک کیږي. له همدې امله، د شومان ماډل لپاره د لامبډا مهم ارزښت دا دی:
60 / 250,4 = 0,239617.
دا چې، د غلطۍ کشف کولو پروسیجرونو ترسره کولو اړتیا باید تر هغه وخته پورې ترسره شي تر څو چې لامبډا، د اوسني 38,964 څخه، 0,239617 ته راټیټ شي.
یا تر هغه چې شاخص N (د غلطیو احتمالي شمیر) منفي n (د غلطیو اصلاح شوي شمیر) د هغه حد څخه ښکته راټیټ شي چې موږ یې غوره کړی (په لومړۍ برخه کې) - 1459 پی سیز.
سرچینه: www.habr.com
