ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي

1. شروعاتي ڊيٽا

ڊيٽا جي صفائي ڊيٽا جي تجزيي جي ڪمن کي منهن ڏيڻ واري چئلينج مان هڪ آهي. هي مواد ترقيات ۽ حلن کي ظاهر ڪري ٿو جيڪو ڪيڊسٽريل ويل جي ٺهڻ ۾ ڊيٽابيس جي تجزيي جي عملي مسئلي کي حل ڪرڻ جي نتيجي ۾ پيدا ٿيو. ذريعن هتي "رپورٽ نمبر 01/OKS-2019 جي نتيجن تي رياستي ڪيڊسٽريل قيمتن جي سڀني قسمن جي حقيقي زمينن جي (سواءِ زمين جي پلاٽن جي) خنٽي-مانسيسڪ خودمختيار اوڪرگ - يوگرا جي علائقي ۾".

فائل "تقابلي ماڊل total.ods" ۾ "ضميمه B. KS 5 جو تعين ڪرڻ جا نتيجا. ڪيڊسٽرل ويليو 5.1 جي تقابلي انداز کي طئي ڪرڻ جي طريقي تي معلومات" تي غور ڪيو ويو.

جدول 1. فائل ۾ ڊيٽا سيٽ جا شمارياتي اشارا "تقابلي ماڊل total.ods"
فيلڊن جو ڪل تعداد، پي سي. - 44
رڪارڊ جو ڪل تعداد، پي سي. - 365 490
اکرن جو ڪل تعداد، پي سي. - 101 714 693
رڪارڊ ۾ اکرن جو سراسري تعداد، پي سي. - 278,297
رڪارڊ ۾ ڪردارن جي معياري انحراف، پي سي. - 15,510
اکرن جو گھٽ ۾ گھٽ تعداد داخل ٿيڻ ۾، پي سي. - 198
اکرن جو وڌ ۾ وڌ انگ اکرن ۾، پي سي. - 363

2. تعارفي حصو. بنيادي معيار

بيان ڪيل ڊيٽابيس جو تجزيو ڪرڻ دوران، صفائي جي درجي جي ضرورتن کي بيان ڪرڻ لاء هڪ ڪم ٺاهيو ويو، ڇاڪاڻ ته، جيئن هر ڪنهن لاء واضح آهي، مخصوص ڊيٽابيس صارفين لاء قانوني ۽ اقتصادي نتيجا پيدا ڪري ٿي. ڪم جي دوران، اهو ظاهر ٿيو ته وڏي ڊيٽا جي صفائي جي درجي لاء ڪي خاص گهربل نه هئا. هن معاملي ۾ قانوني معيارن جو تجزيو ڪندي، مان ان نتيجي تي پهتو آهيان ته اهي سڀ ممڪنات مان ٺهيل آهن. اهو آهي، هڪ خاص ڪم ظاهر ٿيو آهي، معلومات جا ذريعا ڪم لاء مرتب ڪيا ويا آهن، پوء هڪ ڊيٽابيس ٺاهي وئي آهي ۽ ٺاهيل ڊيٽا سيٽ جي بنياد تي، مسئلو حل ڪرڻ لاء اوزار. نتيجو ڪندڙ حل متبادل مان چونڊڻ ۾ حوالا پوائنٽ آهن. مون هن کي شڪل 1 ۾ پيش ڪيو.

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي

جيئن ته، ڪنهن به معيار کي طئي ڪرڻ جي معاملن ۾، اهو بهتر آهي ته ثابت ڪيل ٽيڪنالاجيز تي ڀروسو ڪيو وڃي، مون ان ۾ مقرر ڪيل گهرجن کي چونڊيو. "MHRA GxP ڊيٽا سالميت جي تعريف ۽ صنعت لاء هدايت", ڇاڪاڻ ته مون هن دستاويز کي هن مسئلي لاء سڀ کان وڌيڪ جامع سمجهيو. خاص طور تي، هن دستاويز ۾ سيڪشن چوي ٿو "اهو ياد رکڻ گهرجي ته ڊيٽا جي سالميت جون گهرجون دستي (ڪاغذ) ۽ اليڪٽرانڪ ڊيٽا تي برابر لاڳو ٿين ٿيون. (ترجمو: "...ڊيٽا جي سالميت جون گهرجون دستي (ڪاغذ) ۽ اليڪٽرانڪ ڊيٽا تي برابر لاڳو ٿين ٿيون"). هي فارموليشن خاص طور تي "لکيل ثبوت" جي تصور سان لاڳاپيل آهي، آرٽيڪل 71 جي آرٽيڪل آف سول پروسيجر، آرٽ جي شقن ۾. 70 CAS، آرٽ. 75 APC، "لکڻ ۾" آرٽ. 84 ڪوڊ آف سول پروسيجر.

شڪل 2 فقه ۾ معلومات جي قسمن جي طريقن جي ٺهڻ جو هڪ خاڪو پيش ڪري ٿو.

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
چانور. 2. ذريعو هتي.

شڪل 3 مٿي ڏنل ڪمن لاءِ، شڪل 1 جي ميکانيزم کي ڏيکاري ٿو ”گائيڊنس“. اهو آسان آهي، هڪ مقابلو ڪرڻ سان، اهو ڏسڻ لاء ته استعمال ٿيل طريقا جڏهن معلومات جي سالميت جي گهرجن کي پورو ڪرڻ لاء جديد معيارن ۾ معلومات جي سسٽم لاء خاص طور تي محدود آهن معلومات جي قانوني تصور جي مقابلي ۾.

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
تصوير 3

مخصوص دستاويز ۾ (هدايت)، ٽيڪنيڪل حصي سان ڪنيڪشن، ڊيٽا کي پروسيسنگ ۽ محفوظ ڪرڻ جي صلاحيت، باب 18.2 مان هڪ اقتباس سان چڱي طرح تصديق ڪئي وئي آهي. لاڳاپو ڊيٽابيس: "هي فائل جي جوڙجڪ موروثي طور تي وڌيڪ محفوظ آهي، ڇاڪاڻ ته ڊيٽا هڪ وڏي فائيل فارميٽ ۾ رکيل آهي جيڪا ڊيٽا ۽ ميٽا ڊيٽا جي وچ ۾ تعلق کي محفوظ ڪري ٿي."

حقيقت ۾، هن طريقي ۾ - موجوده ٽيڪنيڪل صلاحيتن مان، غير معمولي ڪجھ به نه آهي ۽، پاڻ ۾، اهو هڪ قدرتي عمل آهي، ڇاڪاڻ ته تصورات جي توسيع سڀ کان وڌيڪ اڀياس ڪيل سرگرمي مان ايندي آهي - ڊيٽابيس ڊيزائن. پر، ٻئي طرف، قانوني معيار ظاهر ٿيندا آهن جيڪي موجوده سسٽم جي ٽيڪنيڪل صلاحيتن تي رعايت نه ڏيندا آهن، مثال طور: GDPR - جنرل ڊيٽا تحفظ ضابطو.

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
چانور. 4. فنل آف ٽيڪنيڪل صلاحيتن (ذريعو).

انهن پهلوئن ۾، اهو واضح ٿئي ٿو ته اصل ڊيٽا سيٽ (تصوير 1) کي، سڀ کان پهريان، محفوظ ٿيڻو پوندو، ۽ ٻيو، ان مان اضافي معلومات ڪڍڻ جو بنياد بڻجڻو پوندو. خير، مثال طور: ٽريفڪ قاعدن کي رڪارڊ ڪرڻ وارا ڪئميرا هر هنڌ آهن، معلومات پروسيسنگ سسٽم ڀڃڪڙي ڪندڙن کي ختم ڪري ٿو، پر ٻين معلومات پڻ ٻين صارفين کي پيش ڪري سگهجي ٿي، مثال طور، هڪ شاپنگ سينٽر ڏانهن گراهڪن جي وهڪري جي جوڙجڪ جي مارڪيٽنگ مانيٽرنگ. ۽ اھو ھڪڙو ذريعو آھي اضافي اضافو قدر جو جڏھن استعمال ڪندي BigDat. اهو بلڪل ممڪن آهي ته هاڻي گڏ ڪيل ڊيٽا سيٽ، مستقبل ۾، ڪنهن ميکانيزم جي مطابق، موجوده وقت ۾ 1700 جي نادر نسخن جي قيمت سان ملندڙ قيمت هوندي. آخرڪار، حقيقت ۾، عارضي ڊيٽا سيٽ منفرد آهن ۽ مستقبل ۾ بار بار ٿيڻ جو امڪان ناهي.

3. تعارفي حصو. تشخيصي معيار

پروسيسنگ جي عمل دوران، غلطين جي هيٺين درجه بندي ترقي ڪئي وئي.

1. نقص طبقو (GOST R 8.736-2011 جي بنياد تي): الف) سسٽماتي غلطيون؛ ب) بي ترتيب غلطيون؛ ج) هڪ غلطي.

2. گھڻائي جي لحاظ کان: الف) مونو تحريف؛ ب) گھڻائي تحريف.

3. نتيجن جي تنقيد جي مطابق: الف) نازڪ؛ ب) نازڪ ناهي.

4. ظهور جو ذريعو:

الف) ٽيڪنيڪل - غلطيون جيڪي سامان جي آپريشن دوران ٿينديون آهن. IoT سسٽم لاءِ ڪافي لاڳاپيل نقص، سسٽم جيڪي ڪميونيڪيشن، سامان (هارڊويئر) جي معيار تي اثر انداز ٿين ٿا.

ب) آپريٽر جون غلطيون - وڏين رينج ۾ غلطيون آپريٽر ٽائپس کان وٺي ان پٽ جي دوران ڊيٽابيس ڊيزائن لاءِ ٽيڪنيڪل وضاحتن ۾ غلطيون.

ج) استعمال ڪندڙ جون غلطيون - هتي سڄي حد ۾ صارف جون غلطيون آهن "لي آئوٽ کي مٽائڻ وسري ويو" کان پيرن لاءِ غلط ميٽر تائين.

5. الڳ ڪلاس ۾ ورهايل:

a) ”سيپاريٽر جو ڪم“ يعني خلا ۽ ”:“ (اسان جي صورت ۾) جڏهن ان کي نقل ڪيو ويو هو؛
ب) لفظ گڏ لکيا؛
c) خدمت جي اکرن کان پوءِ ڪابه جاءِ نه
d) symmetrically گھڻن نشانين: ()، ""، "...".

گڏ ڪيو ويو، شڪل 5 ۾ پيش ڪيل ڊيٽابيس جي غلطين جي سسٽمائيزيشن سان، غلطين کي ڳولڻ ۽ ڊيٽا کي صاف ڪرڻ واري الگورتھم کي ترقي ڪرڻ لاء ھڪڙو مؤثر ڪوآرڊينيٽ سسٽم ٺاھيو ويو آھي مثال طور.

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
چانور. 5. ڊيٽابيس جي ساختي يونٽن سان لاڳاپيل عام غلطيون (ذريعو: Oreshkov V.I.، Paklin N.B. "ڊيٽا مضبوط ڪرڻ جا اهم تصور").

درستگي، ڊومين جي سالميت، ڊيٽا جي قسم، مطابقت، بيڪارگي، مڪمل، نقل، ڪاروباري قاعدن جي مطابقت، ساخت جي وضاحت، ڊيٽا جي بي ترتيبي، وضاحت، بروقت، ڊيٽا جي سالميت جي ضابطن تي عمل ڪرڻ. (صفحو 334. ڊيٽا گودام جا بنيادي اصول IT پروفيشنلز لاءِ / پالراج پونيه.-2nd ايڊ.)

بریکٹ ۾ انگريزي لفظ ۽ روسي مشين ترجمو پيش ڪيو.

درستگي. ڊيٽا جي عنصر لاء سسٽم ۾ ذخيرو ڪيل قيمت ڊيٽا جي عنصر جي موجودگي لاء صحيح قدر آهي. جيڪڏهن توهان وٽ صارف جو نالو آهي ۽ هڪ ايڊريس هڪ رڪارڊ ۾ ذخيرو ٿيل آهي، پوء اهو پتو صحيح پتو آهي انهي نالي سان ڪسٽمر لاءِ. جيڪڏهن توهان آرڊر نمبر 1000 جي رڪارڊ ۾ 12345678 يونٽن جي ترتيب ڏنل مقدار کي ڳوليندا آهيو، ته پوءِ اها مقدار انهي آرڊر لاءِ صحيح مقدار آهي.
[درستگي. ڊيٽا عنصر لاءِ سسٽم ۾ محفوظ ڪيل قيمت ڊيٽا عنصر جي ان واقعي جي لاءِ صحيح قدر آهي. جيڪڏهن توهان وٽ هڪ گراهڪ جو نالو ۽ پتو رڪارڊ ۾ ذخيرو ٿيل آهي، پوء اهو پتو صحيح پتو آهي ڪسٽمر لاءِ انهي نالي سان. جيڪڏهن توهان آرڊر نمبر 1000 جي رڪارڊ ۾ 12345678 يونٽن جي ترتيب ڏنل مقدار کي ڳوليندا آهيو، ته پوءِ اها مقدار ان آرڊر لاءِ صحيح مقدار آهي.]

ڊومين جي سالميت. ھڪڙي خاصيت جي ڊيٽا جي قيمت قابل اجازت، بيان ڪيل قدرن جي حد ۾ اچي ٿي. عام مثال آهي قابل اجازت قدر "مرد" ۽ "عورت" صنفي ڊيٽا جي عنصر لاءِ.
[ڊومين جي سالميت. منسوب ڊيٽا جي قيمت صحيح، بيان ڪيل قدرن جي حد اندر اچي ٿي. هڪ عام مثال آهي صحيح قدر "مرد" ۽ "عورت" صنفي ڊيٽا جي عنصر لاءِ.]

ڊيٽا جو قسم. ڊيٽا جي خاصيت جي قيمت اصل ۾ ذخيرو ٿيل آهي ڊيٽا جي قسم جي طور تي بيان ڪيل ڊيٽا جي خاصيت لاء. جڏهن اسٽور جي نالي جي فيلڊ جي ڊيٽا جي قسم کي بيان ڪيو ويو آهي "ٽيڪسٽ"، انهي فيلڊ جي سڀني مثالن تي مشتمل آهي اسٽور جو نالو ٽيڪسٽ فارميٽ ۾ ڏيکاريل آهي ۽ عددي ڪوڊ نه.
[ڊيٽا جو قسم. ڊيٽا جي وصف جو قدر اصل ۾ ذخيرو ٿيل آهي ڊيٽا جي قسم جي طور تي بيان ڪيل ان خاصيت لاءِ. جيڪڏهن اسٽور جو نالو فيلڊ ڊيٽا جي قسم کي "ٽيڪسٽ" طور بيان ڪيو ويو آهي، هن فيلڊ جي سڀني مثالن تي مشتمل آهي اسٽور جو نالو عددي ڪوڊ جي بجاءِ ٽيڪسٽ فارميٽ ۾ ڏيکاريل آهي.]

تسلسل. ڊيٽا فيلڊ جو فارم ۽ مواد ڪيترن ئي سورس سسٽم ۾ ساڳيو آهي. جيڪڏهن هڪ سسٽم ۾ پراڊڪٽ ABC لاءِ پراڊڪٽ ڪوڊ 1234 آهي، ته پوءِ هن پراڊڪٽ جو ڪوڊ هر سورس سسٽم ۾ 1234 آهي.
[مطابقت. ڊيٽا فيلڊ جو فارم ۽ مواد مختلف ماخذ سسٽم ۾ ساڳيا آهن. جيڪڏهن هڪ سسٽم تي پراڊڪٽ ABC لاءِ پراڊڪٽ ڪوڊ 1234 آهي، ته پوءِ ان پراڊڪٽ جو ڪوڊ هر سورس سسٽم تي 1234 آهي.]

بيڪار. ساڳئي ڊيٽا کي سسٽم ۾ هڪ کان وڌيڪ هنڌن تي ذخيرو نه ڪيو وڃي. جيڪڏهن، ڪارڪردگي جي سببن لاء، هڪ ڊيٽا عنصر ارادي طور تي هڪ سسٽم ۾ هڪ کان وڌيڪ هنڌن تي ذخيرو ٿيل آهي، پوء بيڪارگي کي واضح طور تي سڃاڻپ ۽ تصديق ڪرڻ گهرجي.
[فضوليت. ساڳئي ڊيٽا کي سسٽم ۾ هڪ کان وڌيڪ هنڌن تي محفوظ نه ڪيو وڃي. جيڪڏهن، ڪارڪردگي جي سببن لاء، هڪ ڊيٽا عنصر ارادي طور تي هڪ سسٽم ۾ ڪيترن ئي هنڌن تي ذخيرو ٿيل آهي، پوء بيڪارگي کي واضح طور تي وضاحت ۽ تصديق ڪرڻ گهرجي.]

مڪمليت. سسٽم ۾ ڏنل وصف لاء ڪي به غائب قدر نه آهن. مثال طور، هڪ گراهڪ فائل ۾، هر گراهڪ لاءِ ”رياست“ فيلڊ لاءِ صحيح قدر هجڻ لازمي آهي. آرڊر جي تفصيل لاءِ فائل ۾، آرڊر لاءِ هر تفصيلي رڪارڊ مڪمل طور تي ڀريو وڃي.
[مڪمليت. هن خاصيت لاءِ سسٽم ۾ ڪي به غائب قدر نه آهن. مثال طور، ڪلائنٽ فائل کي هر ڪلائنٽ لاء "اسٽيٽس" فيلڊ لاء صحيح قدر هجڻ گهرجي. آرڊر جي تفصيل واري فائل ۾، هر آرڊر جي تفصيلي رڪارڊ کي مڪمل طور تي مڪمل ڪيو وڃي.]

نقل ڪرڻ. هڪ سسٽم ۾ رڪارڊ جي نقل مڪمل طور تي حل ڪيو ويو آهي. جيڪڏهن پراڊڪٽ فائل کي ڄاڻايل آهي ته نقل ٿيل رڪارڊ آهن، ته پوءِ هر پراڊڪٽ لاءِ سڀ نقل رڪارڊ ڪيا ويندا آهن ۽ هڪ ڪراس ريفرنس ٺاهيو ويندو آهي.
[نقل. سسٽم ۾ رڪارڊ جي نقل کي مڪمل طور تي ختم ڪيو ويو آهي. جيڪڏهن هڪ پراڊڪٽ فائل کي ڄاڻايل آهي ته نقل ٿيل داخلائن تي مشتمل آهي، پوء هر پراڊڪٽ لاء سڀئي نقل داخل ڪيا ويا آهن ۽ هڪ ڪراس ريفرنس ٺاهي وئي آهي.]

ڪاروباري ضابطن جي مطابقت. هر ڊيٽا جي شين جا قدر مقرر ڪيل ڪاروباري قاعدن تي عمل ڪن ٿا. هڪ نيلامي سسٽم ۾، هٽر يا وڪرو جي قيمت ريزرو قيمت کان گهٽ نه ٿي سگهي. بينڪ قرض جي سسٽم ۾، قرض جي بيلنس هميشه مثبت يا صفر هجڻ گهرجي.
[ڪاروباري ضابطن جي تعميل. هر ڊيٽا عنصر جا قدر قائم ڪيل ڪاروباري قاعدن سان عمل ڪن ٿا. هڪ نيلامي سسٽم ۾، هٽر يا وڪرو جي قيمت ريزرو قيمت کان گهٽ نه ٿي سگهي. بئنڪنگ ڪريڊٽ سسٽم ۾، قرض جي بيلنس هميشه مثبت يا صفر هجڻ گهرجي.]

ساخت جي وضاحت. جتي به ڊيٽا شيون قدرتي طور تي انفرادي اجزاء ۾ ترتيب ڏئي سگهجن ٿيون، شيون لازمي طور تي هن چڱي طرح بيان ڪيل جوڙجڪ تي مشتمل هوندي. مثال طور، هڪ فرد جو نالو قدرتي طور پهريون نالو، وچين شروعاتي، ۽ آخري نالو ۾ ورهايل آهي. فردن جي نالن لاءِ قدرن کي لازمي طور تي پهريون نالو، وچين شروعاتي ۽ آخري نالو رکڻو پوندو. ڊيٽا جي معيار جي اها خاصيت معيار جي لاڳو ڪرڻ کي آسان بڻائي ٿي ۽ غائب قدر گھٽائي ٿي.
[تعميراتي يقين. جتي هڪ ڊيٽا عنصر قدرتي طور تي انفرادي اجزاء ۾ ترتيب ڏئي سگهجي ٿو، عنصر کي لازمي طور تي هن چڱي طرح بيان ڪيل جوڙجڪ تي مشتمل هجي. مثال طور، هڪ شخص جو نالو قدرتي طور تي پهريون نالو، وچين شروعاتي، ۽ آخري نالو ۾ ورهايل آهي. انفرادي نالن جي قيمتن کي پهريون نالو، وچين شروعاتي، ۽ آخري نالو طور محفوظ ڪيو وڃي. هي ڊيٽا جي معيار جي خاصيت معيار جي ايپليڪيشن کي آسان بڻائي ٿي ۽ غائب قدر گھٽائي ٿي.]

ڊيٽا بي ترتيب. هڪ فيلڊ صرف ان مقصد لاءِ استعمال ٿيڻ گهرجي جنهن لاءِ اها وضاحت ڪئي وئي آهي. جيڪڏهن فيلڊ ايڊريس-3 ڊگھي پتي لاءِ پتي جي ڪنهن به ممڪن ٽئين لائين لاءِ وضاحت ڪئي وئي آهي، ته پوءِ هي فيلڊ صرف ايڊريس جي ٽئين لائن کي رڪارڊ ڪرڻ لاءِ استعمال ٿيڻ گهرجي. اهو صارف لاءِ فون يا فيڪس نمبر داخل ڪرڻ لاءِ استعمال نه ٿيڻ گهرجي.
[ڊيٽا بي ترتيب. هڪ فيلڊ صرف ان مقصد لاءِ استعمال ٿيڻ گهرجي جنهن لاءِ اها وضاحت ڪئي وئي آهي. جيڪڏهن ايڊريس-3 فيلڊ ڊگھي پتي لاءِ ڪنهن ممڪن ٽئين ايڊريس لائين لاءِ وضاحت ڪئي وئي آهي، ته پوءِ هي فيلڊ صرف ٽئين ايڊريس لائن کي رڪارڊ ڪرڻ لاءِ استعمال ڪيو ويندو. اهو صارف لاءِ ٽيليفون يا فيڪس نمبر داخل ڪرڻ لاءِ استعمال نه ڪيو وڃي.]

وضاحت. ڊيٽا جو عنصر شايد معيار جي ڊيٽا جي ٻين سڀني خاصيتن جو مالڪ هجي پر جيڪڏهن صارف ان جي معني کي واضح طور تي نه سمجھندا آهن، پوء ڊيٽا عنصر استعمال ڪندڙن لاء ڪا به قيمت ناهي. مناسب نالا ڏيڻ وارا ڪنوينشن ڊيٽا عناصر کي استعمال ڪندڙن پاران چڱي طرح سمجھڻ ۾ مدد ڪن ٿا.
[وضاحت. ڊيٽا جي عنصر ۾ سٺي ڊيٽا جون ٻيون سڀئي خاصيتون ٿي سگهن ٿيون، پر جيڪڏهن صارف ان جي معنيٰ کي واضح طور تي نٿا سمجهن، ته پوءِ ڊيٽا عنصر جي صارفين لاءِ ڪا به اهميت نه آهي. صحيح نالو ڏيڻ جي ڪنوينشنز ڊيٽا عناصر کي صارفين پاران چڱي طرح سمجھڻ ۾ مدد ڪن ٿيون.]

بروقت. صارفين کي ڊيٽا جي بروقت اندازي جو اندازو لڳائي ٿو. جيڪڏهن صارفين کي اميد آهي ته گراهڪ جي طول و عرض ڊيٽا هڪ ڏينهن کان وڌيڪ پراڻي نه هوندي، ماخذ سسٽم ۾ ڪسٽمر ڊيٽا ۾ تبديليون ڊيٽا گودام تي روزانو لاڳو ٿيڻ گهرجن.
[بروقت انداز ۾. صارفين ڊيٽا جي بروقت انداز جو اندازو لڳائي ٿو. جيڪڏهن صارفين کي اميد آهي ته ڪسٽمر طول و عرض ڊيٽا هڪ ڏينهن کان وڌيڪ پراڻي نه هوندي، ماخذ سسٽم ۾ ڪسٽمر ڊيٽا ۾ تبديلين کي روزاني بنياد تي ڊيٽا گودام تي لاڳو ڪيو وڃي.]

افاديت. ڊيٽا گودام ۾ هر ڊيٽا عنصر کي صارفين جي گڏ ڪرڻ جي ڪجهه گهرجن کي پورو ڪرڻ گهرجي. ڊيٽا جو عنصر صحيح ۽ اعليٰ معيار جو ٿي سگھي ٿو، پر جيڪڏھن اھو استعمال ڪندڙن لاءِ ڪا به قيمت نه آھي، ته پوءِ اھو مڪمل طور تي غير ضروري آھي ته ان ڊيٽا جو عنصر ڊيٽا گودام ۾ ھجي.
[استعمال. ڊيٽا اسٽور ۾ هر ڊيٽا شيون صارف جي گڏ ڪرڻ جي ڪجهه گهرجن کي پورو ڪرڻ گهرجي. ڊيٽا جو عنصر صحيح ۽ اعليٰ معيار جو ٿي سگھي ٿو، پر جيڪڏھن اھو استعمال ڪندڙن کي قدر نه ٿو ڏئي، ته پوءِ اھو ضروري نه آھي ته ڊيٽا جو عنصر ڊيٽا گودام ۾ ھجي.]

ڊيٽا جي سالميت جي ضابطن تي عمل ڪرڻ. ماخذ سسٽم جي لاڳاپن واري ڊيٽابيس ۾ محفوظ ڪيل ڊيٽا کي لازمي طور تي لازمي طور تي عمل ڪرڻ گهرجي ادارو سالميت ۽ حوالن جي سالميت جي ضابطن تي. ڪا به ٽيبل جيڪا null کي پرائمري ڪنجي جي طور تي اجازت ڏئي ٿي ان ۾ اداري جي سالميت نه آهي. حوالي سان سالميت والدين-ٻارن جي رشتن کي صحيح طريقي سان قائم ڪرڻ تي مجبور ڪري ٿي. ڪسٽمر کان آرڊر جي رشتي ۾، حوالن جي سالميت ڊيٽابيس ۾ هر آرڊر لاءِ ڪسٽمر جي وجود کي يقيني بڻائي ٿي.
[ڊيٽا سالميت جي ضابطن جي تعميل. ماخذ سسٽم جي لاڳاپي واري ڊيٽابيس ۾ ذخيرو ٿيل ڊيٽا کي لازمي طور تي اداري جي سالميت ۽ حوالن واري سالميت جي قاعدن سان عمل ڪرڻ گهرجي. ڪا به ٽيبل جيڪا null کي پرائمري ڪيچ جي طور تي اجازت ڏئي ٿي ان ۾ اداري جي سالميت نه آهي. حوالي جي سالميت والدين ۽ ٻارن جي وچ ۾ تعلق کي صحيح طور تي قائم ڪرڻ تي مجبور ڪري ٿي. ڪسٽمر-آرڊر جي رشتي ۾، حوالن جي سالميت يقيني بڻائي ٿي ته ڊيٽابيس ۾ هر آرڊر لاءِ ڪسٽمر موجود آهي.]

4. ڊيٽا جي صفائي جي معيار

ڊيٽا جي صفائي جو معيار بگ ڊيٽا ۾ بلڪه مشڪل مسئلو آهي. ان سوال جو جواب ڏيڻ ته ڪهڙي درجي جي ڊيٽا صاف ڪرڻ ضروري آهي ڪم مڪمل ڪرڻ لاءِ هر ڊيٽا تجزيه نگار لاءِ بنيادي آهي. اڪثر موجوده مسئلن ۾، هر تجزيه نگار ان کي پاڻ طئي ڪري ٿو ۽ اهو ممڪن ناهي ته ٻاهران ڪو به ان جي حل ۾ هن پہلو جو اندازو لڳائي سگهي. پر هن معاملي ۾ هٿ ۾ ڪم لاء، هي مسئلو انتهائي اهم هو، ڇاڪاڻ ته قانوني ڊيٽا جي reliability هڪ ٿيڻ گهرجي.

آپريشنل اعتبار کي طئي ڪرڻ لاءِ سافٽ ويئر ٽيسٽنگ ٽيڪنالاجيز تي غور ڪرڻ. اڄ انهن ماڊلز کان وڌيڪ آهن 200. ڪيترائي ماڊل استعمال ڪن ٿا دعوي سروسنگ ماڊل:

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
جوڙ. 6

هن ريت سوچڻ: ”جيڪڏهن مليل غلطي هن ماڊل ۾ ناڪامي واري واقعي سان ملندڙ هڪ واقعو آهي، ته پوءِ پيراميٽر ٽي جو اينالاگ ڪيئن ڳولهجي؟ ۽ مون هيٺ ڏنل ماڊل مرتب ڪيو: اچو ته تصور ڪريون ته ٽيسٽ ڪندڙ کي هڪ رڪارڊ چيڪ ڪرڻ ۾ 1 منٽ لڳندو آهي (سوال ۾ موجود ڊيٽابيس لاءِ)، پوءِ سڀني غلطين کي ڳولڻ لاءِ هن کي 365 منٽن جي ضرورت پوندي، جيڪا لڳ ڀڳ 494 سال ۽ 3 آهي. ڪم جي وقت جا مهينا. جيئن اسان سمجھون ٿا، اهو ڪم جو تمام وڏو مقدار آهي ۽ ڊيٽابيس کي جانچڻ جي قيمت هن ڊيٽابيس جي گڏ ڪرڻ واري لاء ممنوع هوندي. هن عڪاسي ۾، خرچن جو معاشي تصور ظاهر ٿئي ٿو ۽ تجزيو ڪرڻ کان پوءِ مان ان نتيجي تي پهتو آهيان ته هي هڪ ڪافي اثرائتو اوزار آهي. اقتصاديات جي قانون جي بنياد تي: "پيداوار جو مقدار (يونن ۾) جنهن تي هڪ فرم جو وڌ ۾ وڌ منافعو حاصل ڪيو وڃي ٿو، ان نقطي تي واقع آهي جتي پيداوار جي نئين يونٽ جي پيداوار جي حد جي قيمت ان قيمت سان مقابلو ڪيو وڃي ٿو جيڪا هن فرم حاصل ڪري سگهي ٿي. نئين يونٽ لاءِ. پوسٽ جي بنياد تي ته هر ايندڙ غلطي کي ڳولڻ لاء رڪارڊ جي وڌيڪ ۽ وڌيڪ جانچ جي ضرورت آهي، اهو هڪ قيمتي عنصر آهي. اهو آهي، ٽيسٽنگ ماڊلز ۾ اختيار ڪيل پوسٽوليٽ هيٺين نموني ۾ جسماني معنيٰ وٺي ٿو: جيڪڏهن i-th غلطي ڳولڻ لاءِ اهو ضروري هو ته n رڪارڊ چيڪ ڪرڻ، پوءِ ايندڙ (i+3) غلطي کي ڳولڻ لاءِ اهو ضروري هوندو. m رڪارڊ چيڪ ڪرڻ ۽ ساڳئي وقت ن

  1. جڏهن رڪارڊ جو تعداد چيڪ ڪيو ويو آهي ان کان اڳ هڪ نئين غلطي ملي ٿي مستحڪم؛
  2. جڏهن ته ايندڙ نقص ڳولڻ کان اڳ چيڪ ڪيل رڪارڊ جو تعداد وڌي ويندو.

نازڪ قدر جو تعين ڪرڻ لاءِ، مون اقتصادي فزيبلٽي جي تصور ڏانهن رخ ڪيو، جنهن کي هن صورت ۾، سماجي لاڳت جي تصور کي استعمال ڪندي، هن ريت ترتيب ڏئي سگهجي ٿو: ”غلطي کي درست ڪرڻ جا خرچ معاشي ايجنٽ کي برداشت ڪرڻ گهرجن، جيڪو ڪري سگهي ٿو. اهو سڀ کان گهٽ قيمت تي. اسان وٽ ھڪڙو ايجنٽ آھي - ھڪڙو امتحان ڪندڙ جيڪو 1 منٽ خرچ ڪري ٿو ھڪڙي رڪارڊ چيڪ ڪرڻ لاء. مالي اصطلاحن ۾، جيڪڏهن توهان ڪمايو 6000 روبل/ڏينهن، اهو ٿيندو 12,2 روبل. (تقريبن اڄ). اهو اقتصادي قانون ۾ توازن جي ٻئي پاسي کي طئي ڪرڻ لاء رهي ٿو. مون هن طرح دليل ڏنو. موجوده غلطي جي ضرورت پوندي ته لاڳاپيل شخص ان کي درست ڪرڻ جي ڪوشش خرچ ڪري، يعني ملڪيت جو مالڪ. اچو ته چئو ته هن عمل جي 1 ڏينهن جي ضرورت آهي (هڪ درخواست جمع ڪريو، هڪ صحيح دستاويز حاصل ڪريو). پوء، سماجي نقطي نظر کان، هن جي قيمت في ڏينهن جي سراسري تنخواه جي برابر هوندي. Khanty-Mansi خودمختيار اوڪروگ ۾ سراسري جمع ٿيل تنخواه "جنوري-سيپٽمبر 2019 لاءِ خانٽي-مانسيسڪ خودمختيار اوڪرگ - يوگرا جي سماجي-اقتصادي ترقي جا نتيجا" 73285 رپيا. يا 3053,542 روبل / ڏينهن. ان جي مطابق، اسان هڪ نازڪ قدر حاصل ڪندا آهيون برابر:
3053,542: 12,2 = 250,4 رڪارڊ جا يونٽ.

ان جو مطلب، سماجي نقطه نظر کان، جيڪڏهن هڪ ٽيسٽر 251 رڪارڊ چيڪ ڪيو ۽ هڪ غلطي ڏٺي، اهو برابر آهي صارف پاڻ هن غلطي کي درست ڪري. ان جي مطابق، جيڪڏهن امتحان ڪندڙ ايندڙ غلطي کي ڳولڻ لاء 252 رڪارڊ چيڪ ڪرڻ جي برابر وقت گذاريو، ته پوء انهي صورت ۾ اهو بهتر آهي ته صارف جي اصلاح جي قيمت کي منتقل ڪرڻ لاء.

هتي هڪ آسان طريقو پيش ڪيو ويو آهي، ڇاڪاڻ ته سماجي نقطه نظر کان، اهو ضروري آهي ته هر هڪ ماهر طرفان پيدا ڪيل سڀني اضافي قيمتن کي، يعني، ٽيڪس ۽ سماجي ادائيگي سميت خرچ، پر ماڊل واضح آهي. هن تعلق جو نتيجو ماهرن لاءِ هيٺين گهرج آهي: آئي ٽي صنعت مان هڪ ماهر کي لازمي طور تي قومي اوسط کان وڌيڪ تنخواه هجڻ گهرجي. جيڪڏهن هن جي تنخواه امڪاني ڊيٽابيس استعمال ڪندڙن جي سراسري تنخواه کان گهٽ آهي، ته پوءِ هن کي پاڻ پوري ڊيٽابيس کي هٿ سان چيڪ ڪرڻ گهرجي.

جڏهن بيان ڪيل معيار کي استعمال ڪندي، ڊيٽابيس جي معيار لاء پهريون گهربل ٺهيل آهي:
I (tr). نازڪ غلطين جو حصو 1/250,4 = 0,39938٪ کان وڌيڪ نه هجڻ گهرجي. کان ٿورو گھٽ صاف ڪرڻ صنعت ۾ سون. ۽ جسماني اصطلاحن ۾ غلطين سان گڏ 1459 کان وڌيڪ رڪارڊ نه آھن.

اقتصادي پٺڀرائي.

حقيقت ۾، رڪارڊ ۾ اهڙيون ڪيتريون ئي غلطيون ڪرڻ سان، سماج جي رقم ۾ معاشي نقصان سان متفق آهن:

1459*3053,542 = 4 روبل.

اها رقم ان حقيقت سان طئي ڪئي وئي آهي ته سماج وٽ انهن خرچن کي گهٽائڻ جا اوزار نه آهن. اهو هيٺ ڏنل آهي ته جيڪڏهن ڪنهن وٽ ٽيڪنالاجي آهي جيڪا انهن کي اجازت ڏئي ٿي ته رڪارڊ جي تعداد کي گهٽائڻ جي غلطي سان، مثال طور، 259، پوء اهو سماج کي بچائڻ جي اجازت ڏيندو:
1200*3053,542 = 3 روبل.

پر ساڳئي وقت، هو پنهنجي ڏات ۽ ڪم لاء پڇي سگهي ٿو، چئو، چئو - 1 ملين روبل.
اهو آهي، سماجي خرچن کي گھٽائي ٿو:

3 – 664 = 250 روبل.

ذات ۾، هي اثر بگ ڊيٽ ٽيڪنالاجيز جي استعمال کان شامل ڪيل قدر آهي.

پر هتي اهو سمجهڻ گهرجي ته اهو هڪ سماجي اثر آهي، ۽ ڊيٽابيس جو مالڪ ميونسپل اختيارين آهي، هن ڊيٽابيس ۾ رڪارڊ ڪيل ملڪيت جي استعمال مان سندن آمدني، 0,3٪ جي شرح تي، آهي: 2,778 بلين روبل / سال. ۽ اهي خرچ (4 روبل) هن کي گهڻو پريشان نه ڪندا آهن، ڇاڪاڻ ته اهي ملڪيت جي مالڪن ڏانهن منتقل ڪيا ويا آهن. ۽، هن پاسو ۾، بگ ڊيٽا ۾ وڌيڪ ريفائننگ ٽيڪنالاجيز جي ڊولپر کي هن ڊيٽابيس جي مالڪ کي قائل ڪرڻ جي صلاحيت ڏيکارڻي پوندي، ۽ اهڙيون شيون وڏي ڏات جي ضرورت هونديون آهن.

ھن مثال ۾، غلطي جي تشخيص الگورٿم چونڊيو ويو آھي Schumann ماڊل جي بنياد تي سافٽ ويئر جي تصديق جي [2] اعتماد جي جاچ دوران. انٽرنيٽ تي ان جي ابتڙ ۽ ضروري شمارياتي اشارن کي حاصل ڪرڻ جي صلاحيت جي ڪري. طريقو Monakhov Yu.M کان ورتو ويو آهي. "انفارميشن سسٽم جي فنڪشنل استحڪام"، تصوير ۾ خراب ڪندڙ جي تحت ڏسو. 7-9.

چانور. 7 - 9 Schumann ماڊل جو طريقوڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي

هن مواد جو ٻيو حصو ڊيٽا جي صفائي جو هڪ مثال پيش ڪري ٿو، جنهن ۾ Schumann ماڊل استعمال ڪرڻ جا نتيجا حاصل ڪيا ويا آهن.
مون کي حاصل ڪيل نتيجا پيش ڪرڻ ڏيو:
غلطين جو تخميني تعداد N = 3167 n.
پيٽرولر سي، ليمبڊا ۽ قابل اعتماد فنڪشن:

ڊيٽا کي صاف ڪريو جهڙوڪ پٿر، ڪاغذ، اسڪسيسر جي راند. ڇا هي راند ختم ٿيڻ سان يا بغير آهي؟ حصو 1. نظرياتي
تصوير 17

لازمي طور تي، lambda شدت جو هڪ حقيقي اشارو آهي جنهن سان هر اسٽيج تي غلطيون معلوم ڪيون ويون آهن. جيڪڏهن توهان ٻئي حصي تي نظر رکون ٿا، هن اشاري لاء تخمينو 42,4 غلطيون في ڪلاڪ هئي، جيڪا ڪافي آهي Schumann اشاري سان. مٿي، اهو طئي ڪيو ويو هو ته اها شرح جنهن تي هڪ ڊولپر غلطيون ڳولي ٿو 1 غلطي في 250,4 رڪارڊ کان گهٽ نه هجڻ گهرجي، جڏهن 1 رڪارڊ في منٽ چيڪ ڪيو وڃي. تنهن ڪري شمن ماڊل لاءِ لامبڊا جي نازڪ قدر:

60/250,4 = 0,239617.

اهو آهي، غلطي ڳولڻ جي طريقيڪار کي کڻڻ جي ضرورت آهي جيستائين لامبڊا، موجوده 38,964 کان، 0,239617 تائين گهٽجي وڃي.

يا جيستائين اشارو N (نقصن جو امڪاني تعداد) مائنس n (نقصن جو درست تعداد) اسان جي قبول ٿيل حد کان گھٽ گھٽجي ٿو - 1459 pcs.

ادب

  1. موناخوف، يو ايم، انفارميشن سسٽم جي فنڪشنل استحڪام. 3 ڪلاڪن ۾. حصو 1. سافٽ ويئر جي اعتبار: درسي ڪتاب. الائونس / يو ايم موناخوف؛ ولاديم. رياست يونيورسٽي - ولاديمير: Izvo Vladim. رياست يونيورسٽي، 2011. - 60 ص. - ISBN 978-5-9984-0189-3.
  2. مارٽن ايل شومن، "سافٽ ويئر جي اعتبار جي اڳڪٿي لاء امڪاني ماڊل."
  3. آئي ٽي پروفيشنلز لاءِ ڊيٽا گودام جا بنيادي اصول / پالراج پونيه. -2nd ايڊ.

حصو ٻيو. نظرياتي

جو ذريعو: www.habr.com

تبصرو شامل ڪريو