ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟
اسٹیچ فکس ٹیم کا ایک مضمون مارکیٹنگ اور پروڈکٹ کے A/B ٹیسٹوں میں غیر کمتری کے ٹرائل کا طریقہ استعمال کرنے کا مشورہ دیتا ہے۔ یہ نقطہ نظر واقعی اس وقت لاگو ہوتا ہے جب ہم ایک نئے حل کی جانچ کر رہے ہوتے ہیں جس میں ایسے فوائد ہوتے ہیں جن کی پیمائش ٹیسٹوں سے نہیں ہوتی ہے۔

سب سے آسان مثال لاگت میں کمی ہے۔ مثال کے طور پر، ہم پہلا سبق تفویض کرنے کے عمل کو خودکار بناتے ہیں، لیکن ہم آخر سے آخر تک کی تبدیلی کو نمایاں طور پر کم نہیں کرنا چاہتے۔ یا ہم ان تبدیلیوں کی جانچ کرتے ہیں جن کا مقصد صارفین کے ایک طبقے کے لیے ہوتا ہے، جبکہ اس بات کو یقینی بناتے ہوئے کہ دوسرے حصوں کے لیے تبادلوں میں زیادہ کمی نہ آئے (کئی مفروضوں کی جانچ کرتے وقت، ترامیم کو نہ بھولیں)۔

درست غیر کمتر مارجن کا انتخاب ٹیسٹ ڈیزائن کے مرحلے کے دوران اضافی چیلنجز کا اضافہ کرتا ہے۔ Δ کا انتخاب کیسے کریں اس سوال کا مضمون میں اچھی طرح سے احاطہ نہیں کیا گیا ہے۔ ایسا لگتا ہے کہ یہ انتخاب کلینکل ٹرائلز میں بھی مکمل طور پر شفاف نہیں ہے۔ کا جائزہ لیں غیر کمتریت پر طبی اشاعتیں رپورٹ کرتی ہیں کہ صرف نصف اشاعتیں حد کے انتخاب کا جواز پیش کرتی ہیں، اور اکثر یہ جواز مبہم ہوتے ہیں یا تفصیلی نہیں ہوتے۔

کسی بھی صورت میں، یہ نقطہ نظر دلچسپ لگتا ہے کیونکہ ... مطلوبہ نمونے کے سائز کو کم کرکے، یہ جانچ کی رفتار کو بڑھا سکتا ہے، اور اس وجہ سے، فیصلہ کرنے کی رفتار۔ - Daria Mukhina، Skyeng موبائل ایپلیکیشن کی مصنوعات کی تجزیہ کار۔

سلائی فکس ٹیم مختلف چیزوں کی جانچ کرنا پسند کرتی ہے۔ پوری ٹیکنالوجی کمیونٹی اصولی طور پر ٹیسٹ چلانا پسند کرتی ہے۔ سائٹ کا کون سا ورژن زیادہ صارفین کو اپنی طرف متوجہ کرتا ہے - A یا B؟ کیا سفارشی ماڈل کا ورژن A ورژن B سے زیادہ پیسہ کماتا ہے؟ مفروضوں کو جانچنے کے لیے، ہم تقریباً ہمیشہ بنیادی شماریات کورس سے آسان ترین طریقہ استعمال کرتے ہیں:

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

اگرچہ ہم اس اصطلاح کو شاذ و نادر ہی استعمال کرتے ہیں، لیکن جانچ کی اس شکل کو "برتری مفروضے کی جانچ" کہا جاتا ہے۔ اس نقطہ نظر کے ساتھ، ہم فرض کرتے ہیں کہ دونوں اختیارات میں کوئی فرق نہیں ہے۔ ہم اس خیال پر قائم رہتے ہیں اور صرف اس صورت میں اسے ترک کرتے ہیں جب ڈیٹا ایسا کرنے کے لیے کافی مجبور ہو - یعنی یہ ظاہر کرتا ہے کہ اختیارات میں سے ایک (A یا B) دوسرے سے بہتر ہے۔

برتری کے مفروضے کی جانچ کرنا مختلف مسائل کے لیے موزوں ہے۔ ہم تجویز کردہ ماڈل کا ورژن B صرف اس صورت میں جاری کرتے ہیں جب یہ پہلے سے زیر استعمال ورژن A سے واضح طور پر بہتر ہو۔ لیکن بعض صورتوں میں، یہ طریقہ اتنا اچھا کام نہیں کرتا ہے۔ آئیے چند مثالیں دیکھتے ہیں۔

1) ہم تھرڈ پارٹی سروس استعمال کرتے ہیں۔، جو جعلی بینک کارڈز کی شناخت میں مدد کرتا ہے۔ ہمیں ایک اور سروس ملی جس کی قیمت کافی کم ہے۔ اگر کوئی سستی سروس اسی طرح کام کرتی ہے جو ہم فی الحال استعمال کرتے ہیں، تو ہم اسے منتخب کریں گے۔ ضروری نہیں ہے کہ یہ آپ کے استعمال کردہ سروس سے بہتر ہو۔

2) ہم ڈیٹا سورس کو ترک کرنا چاہتے ہیں۔ A اور اسے ڈیٹا سورس B سے تبدیل کریں۔ اگر B بہت برے نتائج پیدا کرتا ہے تو ہم A کو چھوڑنے میں تاخیر کر سکتے ہیں، لیکن A کا استعمال جاری رکھنا ممکن نہیں ہے۔

3) ہم ماڈلنگ کے نقطہ نظر سے آگے بڑھنا چاہیں گے۔A سے B کا نقطہ نظر اس لیے نہیں کہ ہم B سے بہتر نتائج کی توقع رکھتے ہیں، بلکہ اس لیے کہ یہ ہمیں زیادہ آپریشنل لچک فراہم کرتا ہے۔ ہمارے پاس یہ یقین کرنے کی کوئی وجہ نہیں ہے کہ B بدتر ہو جائے گا، لیکن اگر ایسا ہے تو ہم منتقلی نہیں کریں گے۔

4) ہم نے کئی معیار کی تبدیلیاں کی ہیں۔ ویب سائٹ کے ڈیزائن (ورژن B) میں اور یقین رکھتے ہیں کہ یہ ورژن ورژن A سے بہتر ہے۔ ہم تبدیلیوں یا کسی بھی اہم کارکردگی کے اشارے میں تبدیلی کی توقع نہیں کرتے ہیں جس کے ذریعے ہم عام طور پر کسی ویب سائٹ کا جائزہ لیتے ہیں۔ لیکن ہم سمجھتے ہیں کہ پیرامیٹرز میں ایسے فوائد ہیں جو یا تو ناپید ہیں یا ہماری ٹیکنالوجی پیمائش کے لیے کافی نہیں ہے۔

ان تمام معاملات میں برتری کی تحقیق سب سے مناسب حل نہیں ہے۔ لیکن ایسے حالات میں زیادہ تر ماہرین اسے بطور ڈیفالٹ استعمال کرتے ہیں۔ اثر کے سائز کا درست تعین کرنے کے لیے ہم احتیاط سے تجربہ کرتے ہیں۔ اگر یہ سچ تھا کہ ورژن A اور B بہت ہی ملتے جلتے طریقوں سے کام کرتے ہیں، تو اس بات کا امکان ہے کہ ہم کالعدم مفروضے کو مسترد کرنے میں ناکام ہو جائیں۔ کیا ہم یہ نتیجہ اخذ کرتے ہیں کہ A اور B بنیادی طور پر ایک ہی کارکردگی کا مظاہرہ کرتے ہیں؟ نہیں! کالعدم مفروضے کو مسترد کرنے میں ناکامی اور کالعدم مفروضے کو قبول کرنا ایک ہی چیز نہیں ہیں۔

نمونے کے سائز کے حساب کتاب (جو یقیناً آپ نے کیے ہیں) عام طور پر قسم II کی غلطی (مسترد کرنے میں ناکامی کا امکان) کے مقابلے میں قسم I کی غلطی (نقل مفروضے کو مسترد کرنے میں ناکامی کا امکان، جسے اکثر الفا کہا جاتا ہے) کے لیے سخت حدود کے ساتھ کیا جاتا ہے۔ null hypothesis، دی گئی شرط کہ null hypothesis غلط ہے، جسے اکثر بیٹا کہا جاتا ہے)۔ الفا کے لیے عام قدر 0,05 ہے، جبکہ بیٹا کے لیے عام قدر 0,20 ہے، جو کہ 0,80 کی شماریاتی طاقت کے مساوی ہے۔ اس کا مطلب ہے کہ اس بات کا 20% امکان ہے کہ ہم اس مقدار کے حقیقی اثر سے محروم ہوجائیں گے جو ہم نے اپنے پاور کے حسابات میں بیان کیا ہے، اور یہ معلومات میں کافی سنگین خلا ہے۔ مثال کے طور پر، آئیے درج ذیل مفروضوں پر غور کریں:

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

H0: میرا بیگ میرے کمرے میں نہیں ہے (3)
H1: میرا بیگ میرے کمرے میں ہے (4)

اگر میں نے اپنے کمرے کی تلاشی لی اور اپنا بیگ ملا، تو بہت اچھا، میں باطل مفروضے کو مسترد کر سکتا ہوں۔ لیکن اگر میں نے کمرے کے ارد گرد دیکھا اور اپنا بیگ نہیں ملا (شکل 1)، تو میں کیا نتیجہ اخذ کروں؟ کیا مجھے یقین ہے کہ یہ وہاں نہیں ہے؟ کیا میں کافی مشکل لگ رہا تھا؟ اگر میں نے صرف 80% کمرے کو تلاش کیا تو کیا ہوگا؟ یہ نتیجہ اخذ کرنا کہ بیگ یقینی طور پر کمرے میں نہیں ہے ایک جلدی فیصلہ ہوگا۔ کوئی تعجب نہیں کہ ہم "نال مفروضے کو قبول نہیں کر سکتے۔"
ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟
ہم نے جس علاقے کی تلاش کی۔
ہمیں بیگ نہیں ملا - کیا ہمیں کالعدم مفروضے کو قبول کرنا چاہئے؟

شکل 1: کمرے کے 80% حصے میں تلاش کرنا تقریباً 80% پاور پر تلاش کرنے کے برابر ہے۔ اگر آپ کو کمرے کا 80% دیکھنے کے بعد بھی بیگ نہیں ملتا ہے، تو کیا آپ یہ نتیجہ اخذ کر سکتے ہیں کہ یہ وہاں نہیں ہے؟

تو اس صورت حال میں ڈیٹا سائنسدان کو کیا کرنا چاہیے؟ آپ مطالعہ کی طاقت کو بہت زیادہ بڑھا سکتے ہیں، لیکن پھر آپ کو ایک بہت بڑے نمونے کی ضرورت ہوگی اور نتیجہ پھر بھی غیر تسلی بخش ہوگا۔

خوش قسمتی سے، طبی تحقیق کی دنیا میں اس طرح کے مسائل کا طویل عرصے سے مطالعہ کیا گیا ہے۔ دوا B دوائی A سے سستی ہے۔ توقع کی جاتی ہے کہ دوائی B منشیات A کے مقابلے میں کم ضمنی اثرات پیدا کرے گی۔ منشیات B کو منتقل کرنا آسان ہے کیونکہ اسے فریج میں رکھنے کی ضرورت نہیں ہے، لیکن منشیات A کرتی ہے۔ آئیے غیر کمتری کے مفروضے کو جانچتے ہیں۔ یہ ظاہر کرنے کے لیے ہے کہ ورژن B ورژن A کی طرح ہی اچھا ہے — کم از کم کچھ پہلے سے طے شدہ غیر عصبیت کے مارجن کے اندر، Δ۔ ہم تھوڑی دیر بعد اس حد کو سیٹ کرنے کے طریقہ کے بارے میں مزید بات کریں گے۔ لیکن ابھی کے لیے مان لیتے ہیں کہ یہ سب سے چھوٹا فرق ہے جو عملی طور پر معنی خیز ہے (کلینیکل ٹرائلز کے تناظر میں، اسے عام طور پر طبی اہمیت کہا جاتا ہے)۔

غیر کمتری کے مفروضے ہر چیز کو اپنے سر پر موڑ دیتے ہیں:

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

اب، یہ ماننے کے بجائے کہ کوئی فرق نہیں ہے، ہم فرض کریں گے کہ ورژن B ورژن A سے بدتر ہے، اور ہم اس مفروضے پر قائم رہیں گے جب تک کہ ہم یہ ظاہر نہ کر دیں کہ ایسا نہیں ہے۔ یہ بالکل وہی لمحہ ہے جب یکطرفہ مفروضے کی جانچ کو استعمال کرنا سمجھ میں آتا ہے! عملی طور پر، یہ اعتماد کا وقفہ بنا کر اور اس بات کا تعین کر کے کیا جا سکتا ہے کہ آیا وقفہ درحقیقت Δ (شکل 2) سے بڑا ہے یا نہیں۔
ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

Δ کو منتخب کریں۔

صحیح Δ کا انتخاب کیسے کریں؟ Δ انتخاب کے عمل میں شماریاتی جواز اور ٹھوس تشخیص شامل ہے۔ طبی تحقیق کی دنیا میں، ریگولیٹری رہنما خطوط موجود ہیں جو یہ حکم دیتے ہیں کہ ڈیلٹا کو طبی لحاظ سے سب سے چھوٹے اہم فرق کی نمائندگی کرنی چاہیے- جو کہ عملی طور پر فرق پیدا کرے گا۔ اپنے آپ کو جانچنے کے لیے یورپی رہنما خطوط کا ایک اقتباس یہ ہے: "اگر فرق کو صحیح طریقے سے منتخب کیا گیا ہے، تو اعتماد کا وقفہ جو مکمل طور پر –∆ اور 0 کے درمیان ہے… غیر کمتری کو ظاہر کرنے کے لیے کافی ہے۔ اگر یہ نتیجہ قابل قبول نہیں لگتا ہے، تو اس کا مطلب ہے کہ ∆ کو مناسب طریقے سے منتخب نہیں کیا گیا تھا۔

ڈیلٹا کو یقینی طور پر حقیقی کنٹرول (پلیسیبو/کوئی علاج) سے متعلق ورژن A کے اثر کے سائز سے زیادہ نہیں ہونا چاہئے، کیونکہ یہ ہمیں یہ کہنے کی طرف لے جاتا ہے کہ ورژن B حقیقی کنٹرول سے بدتر ہے، جبکہ ساتھ ہی "غیر کمتری کا مظاہرہ کرتے ہوئے " آئیے فرض کریں کہ جب ورژن A متعارف کرایا گیا تھا تو اسے ورژن 0 سے تبدیل کر دیا گیا تھا یا یہ فیچر بالکل موجود ہی نہیں تھا (شکل 3 دیکھیں)۔

برتری کے مفروضے کی جانچ کے نتائج کی بنیاد پر، اثر کا سائز E ظاہر ہوا (یعنی غالباً μ^A−μ^0=E)۔ اب A ہمارا نیا معیار ہے، اور ہم اس بات کو یقینی بنانا چاہتے ہیں کہ B اتنا ہی اچھا ہے جتنا A۔ μB−μA≤−Δ (نال مفروضہ) لکھنے کا ایک اور طریقہ μB≤μA−Δ ہے۔ اگر ہم فرض کریں کہ do E کے برابر یا اس سے بڑا ہے، تو μB ≤ μA−E ≤ پلیسبو۔ اب ہم دیکھتے ہیں کہ μB کے لیے ہمارا تخمینہ مکمل طور پر μA−E سے تجاوز کر گیا ہے، جو اس طرح مکمل طور پر کالعدم مفروضے کو مسترد کرتا ہے اور ہمیں یہ نتیجہ اخذ کرنے کی اجازت دیتا ہے کہ B اتنا ہی اچھا ہے جتنا A، لیکن ساتھ ہی ساتھ μB ≤ μ پلیسبو ہو سکتا ہے، جو کہ نہیں ہے۔ کیس. ہمیں کیا ضرورت ہے. (شکل 3)۔

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟
شکل 3. غیر کمتری کے مارجن کو منتخب کرنے کے خطرات کا مظاہرہ۔ اگر کٹ آف بہت زیادہ ہے، تو یہ نتیجہ اخذ کیا جا سکتا ہے کہ B، A سے کمتر ہے، لیکن ساتھ ہی ساتھ پلیسبو سے الگ نہیں کیا جا سکتا۔ ہم ایسی دوائی کا تبادلہ نہیں کریں گے جو واضح طور پر پلیسبو (A) سے زیادہ موثر ہو کسی ایسی دوا کے لیے جو پلیسبو کی طرح موثر ہو۔

α کا انتخاب

آئیے α کو منتخب کرنے کی طرف بڑھتے ہیں۔ آپ معیاری قدر α = 0,05 استعمال کر سکتے ہیں، لیکن یہ مکمل طور پر منصفانہ نہیں ہے۔ جیسے، مثال کے طور پر، جب آپ انٹرنیٹ پر کوئی چیز خریدتے ہیں اور ایک ساتھ کئی ڈسکاؤنٹ کوڈ استعمال کرتے ہیں، حالانکہ انہیں یکجا نہیں کیا جانا چاہیے - ڈویلپر نے صرف ایک غلطی کی، اور آپ اس سے بچ گئے۔ قواعد کے مطابق، α کی قدر α کی نصف قدر کے برابر ہونی چاہیے جو برتری کے مفروضے کی جانچ کرتے وقت استعمال ہوتی ہے، یعنی 0,05/2 = 0,025۔

نمونہ سائز

نمونے کے سائز کا اندازہ کیسے لگایا جائے؟ اگر آپ کو یقین ہے کہ A اور B کے درمیان حقیقی اوسط فرق 0 ہے، تو نمونے کے سائز کا حساب وہی ہے جو برتری کے مفروضے کی جانچ کرتے وقت ہوتا ہے، سوائے اس کے کہ آپ اثر کے سائز کو غیر کمتری کے مارجن سے بدل دیتے ہیں، بشرطیکہ آپ استعمال کریں α غیر کمتر کارکردگی = 1/2α برتری ( α غیر کمتری = 1/2 α برتری)۔ اگر آپ کے پاس یہ ماننے کی وجہ ہے کہ آپشن B آپشن A سے قدرے بدتر ہو سکتا ہے، لیکن آپ یہ ثابت کرنا چاہتے ہیں کہ یہ Δ سے زیادہ بدتر ہے، تو آپ کی قسمت میں ہے! یہ درحقیقت آپ کے نمونے کا سائز کم کر دیتا ہے کیونکہ یہ ظاہر کرنا آسان ہے کہ B A سے بدتر ہے اگر آپ واقعی سوچتے ہیں کہ یہ برابر کی بجائے قدرے بدتر ہے۔

حل کے ساتھ مثال

فرض کریں کہ آپ ورژن B میں اپ گریڈ کرنا چاہتے ہیں، بشرطیکہ یہ 0,1 نکاتی صارفین کے اطمینان کے پیمانے پر ورژن A سے 5 پوائنٹ سے زیادہ برا نہ ہو... آئیے برتری کے مفروضے کا استعمال کرتے ہوئے اس مسئلے سے رجوع کریں۔

برتری کے مفروضے کو جانچنے کے لیے، ہم نمونے کے سائز کا حساب حسب ذیل کریں گے:

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

یعنی، اگر آپ کے گروپ میں 2103 مشاہدات ہیں، تو آپ 90% پر اعتماد ہوسکتے ہیں کہ آپ کو 0,10 یا اس سے زیادہ کا اثر ملے گا۔ لیکن اگر 0,10 آپ کے لیے بہت زیادہ ہے، تو یہ برتری کے مفروضے کو جانچنے کے قابل نہیں ہوگا۔ محفوظ ہونے کے لیے، آپ مطالعہ کو چھوٹے اثر کے سائز کے لیے چلانے کا فیصلہ کر سکتے ہیں، جیسے کہ 0,05۔ اس صورت میں، آپ کو 8407 مشاہدات کی ضرورت ہوگی، یعنی نمونہ تقریباً 4 گنا بڑھ جائے گا۔ لیکن کیا ہوگا اگر ہم اپنے اصل نمونے کے سائز پر قائم رہیں، لیکن طاقت کو بڑھا کر 0,99 کر دیں تاکہ مثبت نتیجہ آنے پر ہم محفوظ رہیں؟ اس صورت میں، ایک گروپ کے لیے n 3676 ہوگا، جو پہلے سے بہتر ہے، لیکن نمونے کے سائز میں 50% سے زیادہ اضافہ کرتا ہے۔ اور نتیجتاً، ہم اب بھی خالی مفروضے کی تردید نہیں کر پائیں گے، اور ہمیں اپنے سوال کا جواب نہیں ملے گا۔

کیا ہوگا اگر ہم اس کے بجائے غیر کمتری کے مفروضے کا تجربہ کریں؟

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

نمونے کے سائز کا حساب ایک ہی فارمولے کو استعمال کرتے ہوئے کیا جائے گا سوائے ڈینومینیٹر کے۔
برتری کے مفروضے کو جانچنے کے لیے استعمال کیے جانے والے فارمولے سے اختلافات درج ذیل ہیں:

— Z1−α/2 کی جگہ Z1−α ہے، لیکن اگر آپ اصول کے مطابق سب کچھ کرتے ہیں، تو آپ α = 0,05 کو α = 0,025 سے بدل دیتے ہیں، یعنی یہ وہی نمبر ہے (1,96)

— (μB−μA) ہرج میں ظاہر ہوتا ہے۔

- θ (اثر سائز) کو Δ (غیر کمتری کا مارجن) سے بدل دیا گیا ہے۔

اگر ہم فرض کرتے ہیں کہ µB = µA، تو (µB − µA) = 0 اور عدم تفاوت کے مارجن کے لیے نمونے کے سائز کا حساب بالکل وہی ہے جو ہم حاصل کریں گے اگر ہم 0,1 کے اثر کے سائز کے لیے برتری کا حساب کریں، بہت اچھا! ہم ایک ہی سائز کا مطالعہ مختلف مفروضوں کے ساتھ کر سکتے ہیں اور نتیجہ اخذ کرنے کے لیے مختلف نقطہ نظر کے ساتھ، اور ہمیں اس سوال کا جواب مل جائے گا جس کا ہم واقعی جواب دینا چاہتے ہیں۔

اب فرض کریں کہ ہم اصل میں یہ نہیں سوچتے کہ µB = µA اور
ہمارا خیال ہے کہ µB تھوڑا برا ہے، شاید 0,01 یونٹس۔ یہ ہمارے ڈینومینیٹر کو بڑھاتا ہے، فی گروپ کے نمونے کے سائز کو کم کر کے 1737 کر دیتا ہے۔

اگر ورژن B اصل میں ورژن A سے بہتر ہے تو کیا ہوگا؟ ہم اس کالعدم مفروضے کو مسترد کرتے ہیں کہ B A سے Δ سے زیادہ بدتر ہے اور متبادل مفروضے کو قبول کرتے ہیں کہ B، اگر بدتر ہے، تو A سے Δ سے بدتر نہیں ہے اور ہو سکتا ہے بہتر ہو۔ اس نتیجے کو ایک کراس فنکشنل پریزنٹیشن میں ڈالنے کی کوشش کریں اور دیکھیں کہ کیا ہوتا ہے (سنجیدگی سے، اسے آزمائیں)۔ مستقبل کی صورت حال میں، کوئی بھی "Δ سے زیادہ بدتر اور شاید بہتر" کے لیے طے نہیں کرنا چاہتا۔

اس معاملے میں، ہم ایک مطالعہ کر سکتے ہیں، جسے بہت مختصر طور پر کہا جاتا ہے "مفروضے کی جانچ کرنا کہ ایک آپشن دوسرے سے بہتر یا کمتر ہے۔" یہ مفروضوں کے دو سیٹ استعمال کرتا ہے:

پہلا مجموعہ (غیر کمتری کے مفروضے کی جانچ کے طور پر):

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

دوسرا مجموعہ (برتری کے مفروضے کی جانچ کرتے وقت اسی طرح):

ہمیں غیر کمتری کے مفروضے کی جانچ کب کرنی چاہیے؟

ہم دوسرے مفروضے کی جانچ صرف اسی صورت میں کرتے ہیں جب پہلا رد کر دیا جائے۔ ترتیب وار جانچ کرتے وقت، ہم مجموعی قسم I غلطی کی شرح (α) کو برقرار رکھتے ہیں۔ عملی طور پر، یہ ذرائع اور جانچ کے درمیان فرق کے لیے 95% اعتماد کا وقفہ بنا کر حاصل کیا جا سکتا ہے تاکہ یہ تعین کیا جا سکے کہ آیا پورا وقفہ -Δ سے زیادہ ہے۔ اگر وقفہ -Δ سے زیادہ نہیں ہوتا ہے، تو ہم null قدر کو مسترد نہیں کر سکتے اور روک نہیں سکتے۔ اگر پورا وقفہ واقعی −Δ سے بڑا ہے، تو ہم جاری رکھیں گے اور دیکھیں گے کہ آیا وقفہ 0 پر مشتمل ہے۔

تحقیق کی ایک اور قسم ہے جس پر ہم نے بحث نہیں کی ہے - مساوات کا مطالعہ۔

اس قسم کے مطالعے کو غیر عصبیت کے مطالعے اور اس کے برعکس تبدیل کیا جا سکتا ہے، لیکن حقیقت میں ان میں ایک اہم فرق ہے۔ عدم تفاوت کے مقدمے کا مقصد یہ ظاہر کرنا ہے کہ آپشن B کم از کم A جتنا اچھا ہے۔ ایک مساوی ٹرائل کا مقصد یہ ظاہر کرنا ہے کہ آپشن B کم از کم A جتنا اچھا ہے۔ اختیار A اتنا ہی اچھا ہے جتنا B، جو زیادہ مشکل ہے۔ بنیادی طور پر، ہم یہ تعین کرنے کی کوشش کر رہے ہیں کہ کیا مطلب میں فرق کے لیے اعتماد کا پورا وقفہ −Δ اور Δ کے درمیان ہے۔ اس طرح کے مطالعے کے لیے نمونے کے بڑے سائز کی ضرورت ہوتی ہے اور یہ کم کثرت سے کیے جاتے ہیں۔ لہذا اگلی بار جب آپ کوئی مطالعہ کریں جس میں آپ کا بنیادی مقصد یہ یقینی بنانا ہے کہ نیا ورژن کوئی بدتر نہیں ہے، تو "قطع مفروضے کو مسترد کرنے میں ناکامی" پر اکتفا نہ کریں۔ اگر آپ واقعی اہم مفروضے کی جانچ کرنا چاہتے ہیں تو مختلف اختیارات پر غور کریں۔

ماخذ: www.habr.com

نیا تبصرہ شامل کریں