راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

В حصہ اول یہ بیان کیا گیا تھا کہ یہ اشاعت کھنٹی-مانسی خود مختار اوکرگ میں رئیل اسٹیٹ کے کیڈسٹرل ویلیو ایشن کے نتائج کے ڈیٹا سیٹ کی بنیاد پر کی گئی تھی۔

عملی حصہ اقدامات کی شکل میں پیش کیا گیا ہے۔ تمام صفائی ایکسل میں کی گئی تھی، کیونکہ سب سے عام ٹول اور بیان کردہ آپریشنز کو ایکسل جاننے والے زیادہ تر ماہرین کے ذریعے دہرایا جا سکتا ہے۔ اور ہاتھ سے کام کرنے کے لیے کافی موزوں ہے۔

صفر کا مرحلہ فائل کو لانچ کرنے اور محفوظ کرنے کا کام ہو گا، چونکہ اس کا سائز 100 ایم بی ہے، پھر ان آپریشنز کی تعداد دسیوں اور سینکڑوں ہونے کے ساتھ، ان میں کافی وقت لگتا ہے۔
کھلنا، اوسطاً، 30 سیکنڈ ہے۔
بچت - 22 سیکنڈ۔

پہلا مرحلہ ڈیٹاسیٹ کے شماریاتی اشارے کے تعین کے ساتھ شروع ہوتا ہے۔

جدول 1۔ ڈیٹاسیٹ کے شماریاتی اشارے
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

ٹیکنالوجی 2.1۔

ہم ایک معاون فیلڈ بناتے ہیں، میرے پاس یہ نمبر کے تحت ہے - AY۔ ہر اندراج کے لیے، ہم فارمولہ بناتے ہیں "=LENGTH(F365502)+LENGTH(G365502)+…+LENGTH(AW365502)"

اسٹیج 2.1 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t21 = 1 گھنٹہ۔
اسٹیج 2.1 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n21 = 0 pcs۔

دوسرا مرحلہ
ڈیٹاسیٹ کے اجزاء کی جانچ کرنا۔
2.2 ریکارڈ میں تمام قدریں معیاری علامتوں کے استعمال سے بنتی ہیں۔ لہذا، آئیے علامتوں کے ذریعہ اعدادوشمار کو ٹریک کریں۔

جدول 2. نتائج کے ابتدائی تجزیے کے ساتھ ڈیٹاسیٹ میں حروف کے شماریاتی اشارے۔راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

ٹیکنالوجی 2.2.1۔

ہم ایک معاون فیلڈ بناتے ہیں - "alpha1"۔ ہر ریکارڈ کے لیے، ہم فارمولہ بناتے ہیں "=CONCATENATE(Sheet1!B9;...Sheet1!AQ9)"
ہم ایک مقررہ اومیگا 1 سیل بناتے ہیں۔ ہم باری باری اس سیل میں 1251 سے 32 تک Windows-255 کے مطابق کریکٹر کوڈ داخل کریں گے۔
ہم ایک معاون فیلڈ بناتے ہیں - "alpha2"۔ فارمولے کے ساتھ "=FIND(SYMBOL(Omega,1);"alpha1",N)"۔
ہم ایک معاون فیلڈ بناتے ہیں - "الفا 3"۔ فارمولے کے ساتھ "=IF(ISNUMBER("alpha2",N),1)"
"=SUM("alpha2"N3: "alpha1"N3)" فارمولے کے ساتھ ایک مقررہ سیل "Omega-365498" بنائیں۔

جدول 3. نتائج کے ابتدائی تجزیہ کے نتائجراک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

جدول 4۔ اس مرحلے پر ریکارڈ کی گئی غلطیاںراک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

اسٹیج 2.2.1 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t221 = 8 گھنٹہ۔
مرحلے 2.2.1 پر درست شدہ غلطیوں کی تعداد (شومن فارمولے کے لیے) n221 = 0 pcs۔

مرحلے 3.
تیسرا مرحلہ ڈیٹاسیٹ کی حالت کو ریکارڈ کرنا ہے۔ ہر ریکارڈ کو ایک منفرد نمبر (ID) اور ہر فیلڈ تفویض کرکے۔ تبدیل شدہ ڈیٹاسیٹ کا اصل سے موازنہ کرنے کے لیے یہ ضروری ہے۔ گروپ بندی اور فلٹرنگ کی صلاحیتوں سے بھرپور فائدہ اٹھانے کے لیے یہ بھی ضروری ہے۔ یہاں ایک بار پھر ہم ٹیبل 2.2.2 کا رخ کرتے ہیں اور ایک ایسی علامت منتخب کرتے ہیں جو ڈیٹاسیٹ میں استعمال نہیں ہوتی ہے۔ ہمیں وہی ملتا ہے جو شکل 10 میں دکھایا گیا ہے۔

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
تصویر 10۔ شناخت کنندگان کو تفویض کرنا۔

اسٹیج 3 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t3 = 0,75 گھنٹہ۔
اسٹیج 3 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n3 = 0 pcs۔

چونکہ شومن فارمولے کا تقاضا ہے کہ مرحلہ غلطیوں کو درست کرکے مکمل کیا جائے۔ آئیے اسٹیج 2 پر واپس آتے ہیں۔

مرحلے 2.2.2.
اس مرحلے میں ہم ڈبل اور ٹرپل اسپیس کو بھی درست کریں گے۔
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
تصویر 11۔ ڈبل خالی جگہوں کی تعداد۔

جدول 2.2.4 میں نشاندہی کی گئی غلطیوں کی اصلاح۔

جدول 5۔ خرابی کی اصلاح کا مرحلہراک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

اس بات کی ایک مثال کہ "e" یا "e" حروف کے استعمال جیسا پہلو کیوں اہم ہے شکل 12 میں پیش کیا گیا ہے۔

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
تصویر 12۔ حرف "ای" میں تضاد۔

مرحلہ 2.2.2 t222 = 4 گھنٹے میں گزارا گیا کل وقت۔
اسٹیج 2.2.2 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n222 = 583 pcs۔

چوتھا مرحلہ۔
فیلڈ فالتو پن کی جانچ کرنا اس مرحلے میں اچھی طرح سے فٹ بیٹھتا ہے۔ 44 فیلڈز میں سے 6 فیلڈز:
7 - ساخت کا مقصد
16 — زیر زمین منزلوں کی تعداد
17 - والدین کا اعتراض
21 - ویلج کونسل
38 — ساخت کے پیرامیٹرز (تفصیل)
40 - ثقافتی ورثہ

ان کے پاس کوئی اندراج نہیں ہے۔ یعنی بے کار ہیں۔
فیلڈ "22 - شہر" میں ایک ہی اندراج ہے، شکل 13۔

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
تصویر 13۔ "شہر" فیلڈ میں صرف اندراج Z_348653 ہے۔

فیلڈ "34 - عمارت کا نام" میں ایسے اندراجات شامل ہیں جو واضح طور پر فیلڈ کے مقصد سے مطابقت نہیں رکھتے، شکل 14۔

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
تصویر 14۔ غیر تعمیل اندراج کی ایک مثال۔

ہم ان فیلڈز کو ڈیٹا سیٹ سے خارج کر دیتے ہیں۔ اور ہم 214 ریکارڈز میں تبدیلی ریکارڈ کرتے ہیں۔

اسٹیج 4 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t4 = 2,5 گھنٹہ۔
اسٹیج 4 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n4 = 222 pcs۔

جدول 6۔ چوتھے مرحلے کے بعد ڈیٹا سیٹ اشارے کا تجزیہ

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی

عام طور پر، اشارے میں تبدیلیوں کا تجزیہ کرتے ہوئے (ٹیبل 6) ہم کہہ سکتے ہیں کہ:
1) معیاری انحراف لیور میں علامتوں کی اوسط تعداد کا تناسب 3 کے قریب ہے، یعنی عام تقسیم کے نشانات ہیں (چھ سگما اصول)۔
2) اوسط لیور سے کم از کم اور زیادہ سے زیادہ لیورز کا ایک اہم انحراف یہ بتاتا ہے کہ خامیوں کی تلاش کے دوران دم کا مطالعہ ایک امید افزا سمت ہے۔

آئیے شومن کے طریقہ کار کا استعمال کرتے ہوئے غلطیوں کو تلاش کرنے کے نتائج کا جائزہ لیں۔

بیکار مراحل

2.1 اسٹیج 2.1 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t21 = 1 گھنٹہ۔
اسٹیج 2.1 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n21 = 0 pcs۔

3 اسٹیج 3 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t3 = 0,75 گھنٹہ۔
اسٹیج 3 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n3 = 0 pcs۔

مؤثر مراحل
2.2 اسٹیج 2.2.1 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t221 = 8 گھنٹہ۔
مرحلے 2.2.1 پر درست شدہ غلطیوں کی تعداد (شومن فارمولے کے لیے) n221 = 0 pcs۔
مرحلہ 2.2.2 t222 = 4 گھنٹے میں گزارا گیا کل وقت۔
اسٹیج 2.2.2 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n222 = 583 pcs۔

مرحلہ 2.2 میں گزارا گیا کل وقت t22 = 8 + 4 = 12 گھنٹے۔
اسٹیج 2.2.2 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n222 = 583 pcs۔

4 اسٹیج 4 پر گزارا گیا کل وقت (شومن فارمولے کے لیے) t4 = 2,5 گھنٹہ۔
اسٹیج 4 پر پائی جانے والی غلطیوں کی تعداد (شومن فارمولے کے لیے) n4 = 222 pcs۔

چونکہ شومن ماڈل کے پہلے مرحلے میں صفر مراحل ہیں جن کو شامل کرنا ضروری ہے، اور دوسری طرف، مراحل 2.2 اور 4 فطری طور پر آزاد ہیں، پھر یہ دیکھتے ہوئے کہ شومن ماڈل یہ فرض کرتا ہے کہ چیک کی مدت میں اضافہ کرنے سے، امکان خرابی کا پتہ لگانے میں کمی آتی ہے، یعنی بہاؤ ناکامی کو کم کرتا ہے، پھر اس بہاؤ کا جائزہ لے کر ہم طے کریں گے کہ کس مرحلے کو پہلے رکھنا ہے، اصول کے مطابق، جہاں ناکامی کی کثافت زیادہ ہوتی ہے، ہم اس مرحلے کو پہلے رکھیں گے۔

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
انجیر 15۔

شکل 15 کے فارمولے سے یہ معلوم ہوتا ہے کہ حساب میں مرحلہ 2.2 سے پہلے چوتھے مرحلے کو رکھنا افضل ہے۔

شومن کے فارمولے کا استعمال کرتے ہوئے، ہم غلطیوں کی تخمینی ابتدائی تعداد کا تعین کرتے ہیں:

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
انجیر 16۔

شکل 16 کے نتائج سے یہ دیکھا جا سکتا ہے کہ غلطیوں کی پیش گوئی کی گئی تعداد N2 = 3167 ہے، جو کہ 1459 کے کم از کم معیار سے زیادہ ہے۔

تصحیح کے نتیجے میں، ہم نے 805 غلطیاں درست کیں، اور پیش گوئی کی گئی تعداد 3167 – 805 = 2362 ہے، جو ابھی بھی ہماری قبول کردہ کم از کم حد سے زیادہ ہے۔

ہم پیرامیٹر C، lambda اور reliability function کی وضاحت کرتے ہیں:

راک، کاغذ، کینچی کے کھیل جیسے ڈیٹا کو صاف کریں۔ کیا یہ کھیل ختم ہونے کے ساتھ یا اس کے بغیر ہے؟ حصہ 2۔ عملی
انجیر 17۔

بنیادی طور پر، لیمبڈا اس شدت کا ایک حقیقی اشارہ ہے جس کے ساتھ ہر مرحلے پر غلطیوں کا پتہ چلا ہے۔ اگر آپ اوپر دیکھیں تو اس اشارے کا پچھلا تخمینہ 42,4 غلطیاں فی گھنٹہ تھا، جو کہ شومن اشارے سے کافی موازنہ ہے۔ اس مواد کے پہلے حصے کی طرف رجوع کرتے ہوئے، یہ طے پایا کہ جس شرح پر ایک ڈویلپر کو غلطیاں ملتی ہیں وہ 1 ریکارڈ فی منٹ چیک کرتے وقت، فی 250,4 ریکارڈز میں 1 غلطی سے کم نہیں ہونی چاہیے۔ لہذا شومن ماڈل کے لیے لیمبڈا کی اہم قدر:
60 / 250,4 = 0,239617۔

یعنی، غلطی کا پتہ لگانے کے طریقہ کار کو انجام دینے کی ضرورت اس وقت تک کی جانی چاہیے جب تک کہ لیمبڈا، موجودہ 38,964 سے کم ہو کر 0,239617 تک نہ پہنچ جائے۔

یا جب تک کہ اشارے N (خرابیوں کی ممکنہ تعداد) مائنس n (غلطیوں کی درست تعداد) ہم نے قبول کی گئی حد سے نیچے کم ہو جائے (پہلے حصے میں) - 1459 پی سیز۔

حصہ 1۔ نظریاتی۔

ماخذ: www.habr.com

نیا تبصرہ شامل کریں