သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။
Stitch Fix အဖွဲ့မှ ဆောင်းပါးတစ်ပုဒ်သည် စျေးကွက်ရှာဖွေရေးနှင့် ထုတ်ကုန် A/B စမ်းသပ်မှုများတွင် သိမ်ငယ်မှုမရှိသော စမ်းသပ်မှုချဉ်းကပ်နည်းကို အသုံးပြုရန် အကြံပြုထားသည်။ စမ်းသပ်မှုဖြင့်တိုင်းတာခြင်းမဟုတ်သော အကျိုးကျေးဇူးများပါရှိသော အဖြေအသစ်တစ်ခုကို စမ်းသပ်သောအခါ ဤချဉ်းကပ်မှုသည် အမှန်တကယ် အကျုံးဝင်ပါသည်။

အရိုးရှင်းဆုံး ဥပမာမှာ ကုန်ကျစရိတ် လျှော့ချခြင်း ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် ပထမသင်ခန်းစာကို သတ်မှတ်ခြင်းလုပ်ငန်းစဉ်ကို အလိုအလျောက်လုပ်ဆောင်ပေးသည်၊ သို့သော် ကျွန်ုပ်တို့သည် အဆုံးမှအဆုံးသို့ပြောင်းလဲခြင်းကို သိသိသာသာလျှော့ချလိုခြင်းမရှိပါ။ သို့မဟုတ် ကျွန်ုပ်တို့သည် အသုံးပြုသူများ၏ အစိတ်အပိုင်းတစ်ခုအတွက် ရည်ရွယ်သည့် အပြောင်းအလဲများကို စမ်းသပ်သည်၊၊ အခြားအပိုင်းများအတွက် ပြောင်းလဲမှုများသည် များစွာကျဆင်းသွားမည်မဟုတ်ကြောင်း သေချာစေပြီး (ယူဆချက်များစွာကို စမ်းသပ်သောအခါ၊ ပြင်ဆင်မှုများကို မမေ့ပါနှင့်)။

မှန်ကန်သော သိမ်ငယ်မှုမရှိသောအနားသတ်ကို ရွေးချယ်ခြင်းသည် စမ်းသပ်ဒီဇိုင်းအဆင့်အတွင်း နောက်ထပ်စိန်ခေါ်မှုများ တိုးစေပါသည်။ Δ ကိုဘယ်လိုရွေးချယ်ရမလဲဆိုတဲ့မေးခွန်းကို ဆောင်းပါးမှာ ကောင်းကောင်းမဖော်ပြထားပါဘူး။ လက်တွေ့စမ်းသပ်မှုများတွင်လည်း ဤရွေးချယ်မှုသည် လုံးလုံးလျားလျား ပွင့်လင်းမြင်သာမှု မရှိပုံရသည်။ ယေဘုယျအမြင် နယ်နိမိတ်၏ရွေးချယ်မှုကို မျှတမှုမရှိသော စာစောင်များ၏ ထက်ဝက်မျှသာ သိမ်ငယ်ခြင်းမရှိသော အစီရင်ခံစာများတွင် ဆေးဘက်ဆိုင်ရာ ပုံနှိပ်ထုတ်ဝေမှုများသည် မကြာခဏဆိုသလို ဤအကြောင်းပြချက်များသည် မရှင်းလင်းသော သို့မဟုတ် အသေးစိတ်မဖော်ပြထားပေ။

မည်သို့ပင်ဆိုစေကာမူ ဤချဉ်းကပ်ပုံသည် စိတ်ဝင်စားဖွယ်ကောင်းသောကြောင့် ... လိုအပ်သောနမူနာအရွယ်အစားကို လျှော့ချခြင်းဖြင့်၊ ၎င်းသည် စမ်းသပ်မှု၏အရှိန်ကို မြှင့်တင်နိုင်ပြီး၊ ထို့ကြောင့် ဆုံးဖြတ်ချက်ချခြင်း၏ အရှိန်ကို မြှင့်တင်နိုင်သည်။ — Skyeng မိုဘိုင်းအက်ပလီကေးရှင်းအတွက် ထုတ်ကုန်သုံးသပ်သူ Daria Mukhina

Stitch Fix အဖွဲ့သည် မတူညီသောအရာများကို စမ်းသပ်ရန် နှစ်သက်သည်။ နည်းပညာအသိုက်အဝန်းတစ်ခုလုံးသည် မူအရ စာမေးပွဲများကို နှစ်သက်ကြသည်။ မည်သည့်ဆိုက်၏ဗားရှင်းသည် သုံးစွဲသူများကို ပိုမိုဆွဲဆောင်နိုင်သည် - A သို့မဟုတ် B။ အကြံပြုချက်မော်ဒယ်၏ ဗားရှင်း A သည် ဗားရှင်း B ထက် ငွေပိုရပါသလား။ အယူအဆများကို စမ်းသပ်ရန်အတွက် အခြေခံစာရင်းအင်းသင်တန်းမှ အရိုးရှင်းဆုံးချဉ်းကပ်နည်းကို အမြဲတမ်းနီးပါး အသုံးပြုသည်-

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

ဝေါဟာရကို ကျွန်ုပ်တို့သုံးခဲသော်လည်း ဤစမ်းသပ်မှုပုံစံကို "သာလွန်သောယူဆချက်စမ်းသပ်ခြင်း" ဟုခေါ်သည်။ ဤနည်းလမ်းဖြင့်၊ ရွေးချယ်စရာနှစ်ခုကြားတွင် ကွာခြားမှုမရှိဟု ကျွန်ုပ်တို့ယူဆပါသည်။ ကျွန်ုပ်တို့သည် ဤအယူအဆကို စွဲစွဲမြဲမြဲ စွဲကိုင်ထားပြီး ဒေတာသည် ထိုသို့လုပ်ဆောင်ရန် လုံလောက်သော ဆွဲဆောင်မှုရှိမှသာ စွန့်လွှတ်လိုက်ပါ- ဆိုလိုသည်မှာ၊ ရွေးချယ်စရာများထဲမှ တစ်ခု (A သို့မဟုတ် B) သည် အခြားတစ်ခုထက် ပိုကောင်းကြောင်း သက်သေပြနေပါသည်။

သာလွန်မှုသဘောတရားကို စမ်းသပ်ခြင်းသည် ပြဿနာအမျိုးမျိုးအတွက် သင့်လျော်သည်။ အသုံးပြုပြီးသား ဗားရှင်း A ထက် သိသိသာသာ ကောင်းမွန်ပါက အကြံပြုချက် မော်ဒယ်၏ ဗားရှင်း B ကိုသာ ထုတ်ပြန်ပါသည်။ သို့သော် အချို့ကိစ္စများတွင်၊ ဤနည်းလမ်းသည် အလွန်အလုပ်မဖြစ်ပါ။ ဥပမာအနည်းငယ်ကို ကြည့်ကြပါစို့။

1) ကျွန်ုပ်တို့သည် ပြင်ပအဖွဲ့အစည်း ဝန်ဆောင်မှုကို အသုံးပြုပါသည်။ဘဏ်ကတ်အတုများကို ဖော်ထုတ်ရာတွင် ကူညီပေးသည်။ ကုန်ကျစရိတ် သိသိသာသာနည်းသော အခြားဝန်ဆောင်မှုတစ်ခုကို ကျွန်ုပ်တို့တွေ့ရှိခဲ့သည်။ စျေးသက်သာသော ဝန်ဆောင်မှုတစ်ခုသည် ကျွန်ုပ်တို့ လက်ရှိအသုံးပြုနေသည့်အတိုင်း အဆင်ပြေပါက၊ ၎င်းကို ကျွန်ုပ်တို့ ရွေးချယ်မည်ဖြစ်သည်။ သင်အသုံးပြုနေတဲ့ ဝန်ဆောင်မှုထက် ပိုကောင်းနေဖို့ မလိုပါဘူး။

2) ကျွန်ုပ်တို့သည် ဒေတာအရင်းအမြစ်ကို စွန့်လွှတ်လိုပါသည်။ A ကို ဒေတာရင်းမြစ် B ဖြင့် အစားထိုးပါ။ B သည် အလွန်ဆိုးရွားသော ရလဒ်များ ထုတ်ပေးပါက A ကို စွန့်လွှတ်ရန် နှောင့်နှေးနိုင်သော်လည်း A ကို ဆက်လက်အသုံးပြုရန် မဖြစ်နိုင်ပါ။

၃) ကျွန်ုပ်တို့သည် မော်ဒယ်လ်ချဉ်းကပ်မှုမှ ရွေ့ပြောင်းလိုပါသည်။A မှ B ၏ချဉ်းကပ်မှုသည် B ထံမှပိုမိုကောင်းမွန်သောရလဒ်များကိုမျှော်လင့်ထားသောကြောင့်မဟုတ်ဘဲ၊ ၎င်းသည်ကျွန်ုပ်တို့အားပိုမိုကြီးမားသောလည်ပတ်မှုပြောင်းလွယ်ပြင်လွယ်ပေးသောကြောင့်ဖြစ်သည်။ B သည် ပိုဆိုးလာမည်ဟု ကျွန်ုပ်တို့ ယုံကြည်ရန် အကြောင်းမရှိသော်လည်း ဤအခြေအနေမျိုးဆိုလျှင် ကျွန်ုပ်တို့သည် အသွင်ကူးပြောင်းရေးကို လုပ်ဆောင်မည်မဟုတ်ပါ။

4) ကျွန်ုပ်တို့သည် အရည်အသွေးပိုင်းဆိုင်ရာ အပြောင်းအလဲများစွာ ပြုလုပ်ထားပါသည်။ ဝဘ်ဆိုဒ်ဒီဇိုင်း (ဗားရှင်း B) တွင် ဤဗားရှင်းသည် ဗားရှင်း A ထက် သာလွန်သည်ဟု ယုံကြည်ပါသည်။ ကျွန်ုပ်တို့သည် ပုံမှန်အားဖြင့် ဝဘ်ဆိုက်တစ်ခုအား အကဲဖြတ်ပေးသော အဓိကစွမ်းဆောင်ရည်ညွှန်းကိန်းများ သို့မဟုတ် ပြောင်းလဲခြင်းဆိုင်ရာ ပြောင်းလဲမှု သို့မဟုတ် သော့ချက်အညွှန်းကိန်းများကို ကျွန်ုပ်တို့ မမျှော်လင့်ပါ။ သို့သော် တိုင်းတာ၍မရသော သို့မဟုတ် ကျွန်ုပ်တို့၏နည်းပညာသည် တိုင်းတာရန် မလုံလောက်သည့် ဘောင်များတွင် အကျိုးကျေးဇူးများရှိသည်ဟု ကျွန်ုပ်တို့ယုံကြည်ပါသည်။

ဤကိစ္စရပ်အားလုံးတွင် သာလွန်မှုသုတေသနသည် အသင့်လျော်ဆုံးဖြေရှင်းချက်မဟုတ်ပေ။ သို့သော် ထိုသို့သောအခြေအနေများတွင် ကျွမ်းကျင်သူအများစုသည် ၎င်းကို မူရင်းအတိုင်း အသုံးပြုကြသည်။ အကျိုးသက်ရောက်မှု အရွယ်အစားကို မှန်ကန်စွာ ဆုံးဖြတ်ရန် ကျွန်ုပ်တို့ ဂရုတစိုက် စမ်းသပ်မှု ပြုလုပ်ပါသည်။ ဗားရှင်း A နှင့် B သည် အလွန်တူညီသောနည်းလမ်းများဖြင့် အလုပ်လုပ်သည်မှန်ပါက၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်နိုင်သည့် အခွင့်အရေးရှိပါသည်။ A နှင့် B သည် အခြေခံအားဖြင့် တူညီသည်ဟု ကျွန်ုပ်တို့ ကောက်ချက်ချပါသလား။ မဟုတ်ဘူး! null hypothesis ကို ငြင်းပယ်ခြင်း နှင့် null hypothesis ကို လက်ခံခြင်း တို့သည် တူညီသည် မဟုတ်ပါ။

နမူနာ အရွယ်အစား တွက်ချက်မှုများ (သေချာပါတယ်၊ သင်ပြီးပါပြီ) သည် Type I error အတွက် တင်းကျပ်သော ဘောင်များဖြင့် လုပ်ဆောင်သည် (အချည်းနှီးသော အယူအဆကို မကြာခဏ alpha ဟုခေါ်သည်) သည် Type II error (ငြင်းပယ်ရန် ပျက်ကွက်ခြင်း၏ ဖြစ်နိုင်ခြေ ထက် ကန့်သတ်ချက်များဖြင့် လုပ်ဆောင်သည် null hypothesis သည် null hypothesis သည် false ဖြစ်ပြီး beta ဟုခေါ်သည်)။ အယ်လ်ဖာအတွက် ပုံမှန်တန်ဖိုးသည် 0,05 ဖြစ်ပြီး၊ ဘီတာအတွက် ပုံမှန်တန်ဖိုးမှာ 0,20 ဖြစ်ပြီး၊ ကိန်းဂဏန်းဆိုင်ရာ ပါဝါ 0,80 နှင့် သက်ဆိုင်သည်။ ဆိုလိုသည်မှာ ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏ ပါဝါတွက်ချက်မှုများတွင် သတ်မှတ်ထားသည့် ပမာဏ၏ စစ်မှန်သောအကျိုးသက်ရောက်မှုကို လက်လွှတ်နိုင်ခြေ 20% ရှိပြီး ၎င်းသည် သတင်းအချက်အလက်အတွက် အလွန်လေးနက်သောကွာဟချက်ဖြစ်သည်။ ဥပမာအနေနဲ့၊ အောက်ပါ ယူဆချက်တွေကို သုံးသပ်ကြည့်ရအောင်။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

H0 : ငါ့ကျောပိုးအိတ်က အခန်း (၃) မှာမရှိဘူး၊
H1 : ငါ့ကျောပိုးအိတ်က အခန်း (၄) မှာရှိတယ်၊

ကျွန်ုပ်၏အခန်းကိုရှာဖွေပြီး ကျွန်ုပ်၏ကျောပိုးအိတ်ကိုတွေ့ရှိပါက၊ အလွန်ကောင်းမွန်သော၊ အချည်းနှီးသောယူဆချက်ကို ငြင်းပယ်နိုင်သည်။ ဒါပေမယ့် အခန်းပတ်ပတ်လည်ကို ကြည့်လိုက်တော့ ကျောပိုးအိတ် (ပုံ ၁) ကို ရှာမတွေ့ရင် ဘယ်ကောက်ချက်ဆွဲရမလဲ။ အဲဒါမရှိဘူးဆိုတာ သေချာလား? ငါကြည့်ရတာ ခက်နေပြီလား? အခန်းရဲ့ 1% ကိုပဲ ရှာလိုက်ရင် ဘာဖြစ်မလဲ။ ကျောပိုးအိတ်က အခန်းထဲမှာ မရှိဘူးလို့ နိဂုံးချုပ်လိုက်တာက အဖုအထစ်ဖြစ်မယ့် ဆုံးဖြတ်ချက်ပါပဲ။ ကျွန်ုပ်တို့သည် "အချည်းနှီးသောယူဆချက်" ကို လက်မခံနိုင်သည်မှာ အံ့သြစရာမရှိပါ။
သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။
ကျွန်တော်တို့ ရှာဖွေခဲ့တဲ့ နေရာ
ကျောပိုးအိတ်ကို ရှာမတွေ့ပါ - ကျွန်ုပ်တို့သည် null hypothesis ကို လက်ခံသင့်ပါသလား။

ပုံ 1- အခန်းတစ်ခန်း၏ 80% ကိုရှာဖွေခြင်းသည် 80% ပါဝါဖြင့်ရှာဖွေခြင်းနှင့် အကြမ်းဖျင်းတူသည်။ အခန်း၏ 80% ကိုရှာဖွေပြီးနောက် ကျောပိုးအိတ်ကို ရှာမတွေ့ပါက၊ ၎င်းသည် ထိုနေရာတွင် မရှိဟု သင်ယူဆနိုင်ပါသလား။

ဒီတော့ ဒီအခြေအနေမှာ ဒေတာပညာရှင်တစ်ယောက် ဘာလုပ်သင့်သလဲ။ သင်သည် လေ့လာမှု၏ စွမ်းအားကို များစွာတိုးမြှင့်နိုင်သော်လည်း ထို့နောက်တွင် သင်သည် များစွာပိုကြီးသော နမူနာအရွယ်အစားကို လိုအပ်မည်ဖြစ်ပြီး ရလဒ်မှာ ကျေနပ်ဖွယ်မရှိပေ။

ကံကောင်းထောက်မစွာ၊ ထိုကဲ့သို့သောပြဿနာများကိုလက်တွေ့သုတေသနလောကတွင်ကြာရှည်စွာလေ့လာခဲ့သည်။ ဆေး B သည် ဆေး A ထက် စျေးသက်သာသည်။ ဆေးဝါး B သည် ဆေးဝါး A ထက် ဘေးထွက်ဆိုးကျိုး နည်းပါးမည်ဟု မျှော်လင့်ရသည်။ ဆေး B သည် အအေးခန်း မလိုအပ်သော်လည်း ဆေးဝါး A ကြောင့် သယ်ယူရ ပိုလွယ်ကူသည်။ သိမ်ငယ်ခြင်းမရှိသော သဘောတရားကို စမ်းသပ်ကြည့်ကြပါစို့။ ဤသည်မှာ ဗားရှင်း B သည် ဗားရှင်း A ကဲ့သို့ ကောင်းမွန်ကြောင်း ပြသခြင်းဖြစ်သည်—အနည်းဆုံး ကြိုတင်သတ်မှတ်ထားသော သိမ်ငယ်မှုမဟုတ်သောအနားသတ်အချို့တွင်၊ Δ။ ဤကန့်သတ်ချက်ကို မည်သို့သတ်မှတ်ရမည်အကြောင်း အနည်းငယ်ကြာသောအခါတွင် ကျွန်ုပ်တို့ ဆက်လက်ဆွေးနွေးပါမည်။ ဒါပေမယ့် အခုအချိန်မှာ ဒါက လက်တွေ့ကျကျ အဓိပ္ပာယ်ရှိတဲ့ အသေးငယ်ဆုံး ခြားနားချက် (လက်တွေ့စမ်းသပ်မှုတွေရဲ့ ဆက်စပ်မှုမှာ၊ ဒါကို အများအားဖြင့် ဆေးခန်းအရေးပါမှုလို့ ခေါ်ပါတယ်)။

သိမ်ငယ်စိတ်မရှိသော ယူဆချက်များသည် အရာအားလုံးကို ၎င်း၏ခေါင်းပေါ်သို့ ပြောင်းလဲစေသည်-

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

ယခု၊ ကွဲပြားမှုမရှိဟု ယူဆမည့်အစား ဗားရှင်း B သည် ဗားရှင်း A ထက် ပိုဆိုးသည်ဟု ကျွန်ုပ်တို့ယူဆမည်ဖြစ်ပြီး၊ ဤယူဆချက်ကို ကျွန်ုပ်တို့ မပြသမချင်း ဤယူဆချက်ကို လိုက်နာပါမည်။ တစ်ဖက်သတ်ယူဆချက် စမ်းသပ်ခြင်းကို အသုံးပြုခြင်းသည် အဓိပ္ပာယ်ပြည့်ဝသည့် အခိုက်အတန့်ဖြစ်သည်။ လက်တွေ့တွင်၊ ယုံကြည်မှုကြားကာလကိုတည်ဆောက်ပြီး ကြားကာလသည် Δ (ပုံ 2) ထက် အမှန်တကယ်ကြီးမားသည်ရှိမရှိ ဆုံးဖြတ်ခြင်းဖြင့် ၎င်းကိုလုပ်ဆောင်နိုင်သည်။
သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

Δ ကို ရွေးပါ။

Δ မှန်တာကို ဘယ်လိုရွေးမလဲ။ Δ ရွေးချယ်မှုလုပ်ငန်းစဉ်တွင် စာရင်းအင်းဆိုင်ရာ မျှတမှုနှင့် ခိုင်မာသော အကဲဖြတ်ခြင်းများ ပါဝင်သည်။ လက်တွေ့သုတေသနလောကတွင်၊ မြစ်ဝကျွန်းပေါ်ဒေသသည် အသေးငယ်ဆုံးသော ဆေးခန်းဆိုင်ရာ သိသာထင်ရှားသော ခြားနားချက်ကို ကိုယ်စားပြုသင့်သည်—လက်တွေ့တွင် ခြားနားစေမည့် စည်းမျဉ်းလမ်းညွှန်ချက်များ ရှိပါသည်။ ဤသည်မှာ သင့်ကိုယ်သင် စမ်းသပ်ရန် ဥရောပလမ်းညွှန်ချက်များမှ ကိုးကားချက်ဖြစ်သည်- “ခြားနားချက်ကို မှန်ကန်စွာရွေးချယ်ပြီးပါက၊ –∆ နှင့် 0… အကြားတွင် လုံးလုံးလျားလျားတည်ရှိနေသည့် ယုံကြည်မှုကြားကာလသည် သိမ်ငယ်ခြင်းမရှိကြောင်းပြသရန် လုံလောက်ပါသေးသည်။ အကယ်၍ ဤရလဒ်သည် လက်ခံနိုင်ပုံမပေါ်ပါက၊ ∆ သင့်လျော်စွာ ရွေးချယ်ထားခြင်း မရှိကြောင်း ဆိုလိုသည်။”

မြစ်ဝကျွန်းပေါ်ဒေသသည် စစ်မှန်သောထိန်းချုပ်မှု (placebo/မရှိသောကုသမှု) နှင့် ပတ်သက်သည့် ဗားရှင်း A ၏ အကျိုးသက်ရောက်မှုအရွယ်အစားထက် မကျော်လွန်သင့်ပါ။ ၎င်းသည် ကျွန်ုပ်တို့အား ဗားရှင်း B သည် စစ်မှန်သောထိန်းချုပ်မှုထက် ပိုဆိုးသည်ဟု ဆိုနိုင်ပြီး တစ်ချိန်တည်းတွင် "သိမ်ငယ်မှုမရှိခြင်းကို ပြသနေပါသည်။ ” ဗားရှင်း A ကို မိတ်ဆက်သောအခါ၊ ၎င်းကို ဗားရှင်း 0 ဖြင့် အစားထိုးခဲ့သည် သို့မဟုတ် အင်္ဂါရပ် လုံးဝမရှိဟု ယူဆကြပါစို့ (ပုံ 3 ကိုကြည့်ပါ)။

သာလွန်မှု အယူအဆကို စမ်းသပ်ခြင်း၏ ရလဒ်များအပေါ် အခြေခံ၍ အကျိုးသက်ရောက်မှု အရွယ်အစား E ကို ထုတ်ဖော်ခဲ့သည် (ဆိုလိုသည်မှာ μ^A−μ^0=E) ဟု ယူဆရသည်။ ယခု A သည် ကျွန်ုပ်တို့၏စံနှုန်းအသစ်ဖြစ်ပြီး B သည် A ကဲ့သို့ ကောင်းမွန်ကြောင်း သေချာစေလိုပါသည်။ μB−μA≤−Δ (null hypothesis) သည် μB≤μA−Δ ဟုရေးရန် နောက်တစ်နည်းဖြစ်သည်။ ၎င်းသည် E နှင့် ညီမျှသည် သို့မဟုတ် ကြီးသည်ဟု ကျွန်ုပ်တို့ယူဆပါက μB ≤ μA−E ≤ placebo ဖြစ်သည်။ ယခုကျွန်ုပ်တို့၏ μB အတွက် ခန့်မှန်းချက်သည် μA−E သည် လုံးဝကျော်လွန်သွားသည်ကိုတွေ့မြင်ရပြီး၊ ထို့ကြောင့် null hypothesis ကို လုံးဝငြင်းပယ်ပြီး B သည် A ကဲ့သို့ ကောင်းမွန်ကြောင်း ကောက်ချက်ချနိုင်စေမည့် တစ်ချိန်တည်းတွင် μB သည် ≤ μ placebo ဖြစ်နိုင်သည်၊၊ case။ဘာလိုလဲ။ ပုံ (၃)။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။
ပုံ 3။ နိမ့်ကျသော အနားသတ်ကို ရွေးချယ်ခြင်း၏ အန္တရာယ်များကို သရုပ်ပြခြင်း။ ဖြတ်တောက်မှု များလွန်းပါက B သည် A ထက် နိမ့်သည်ဟု ကောက်ချက်ချနိုင်သော်လည်း တစ်ချိန်တည်းတွင် placebo နှင့် ခွဲခြား၍မရပေ။ placebo (A) ထက် သိသိသာသာ ပိုထိရောက်သော ဆေးဝါးကို placebo ကဲ့သို့ ထိရောက်သော ဆေးဝါးနှင့် လဲလှယ်မည်မဟုတ်ပါ။

α ရွေးချယ်မှု

α ရွေးချယ်ခြင်းသို့ ဆက်သွားကြပါစို့။ စံတန်ဖိုး α = 0,05 ကို သင်သုံးနိုင်သော်လည်း ၎င်းသည် လုံးဝမျှတမှု မရှိပါ။ ဥပမာအားဖြင့်၊ သင်အွန်လိုင်းတွင် တစ်ခုခုဝယ်ပြီး လျှော့စျေးကုဒ်များစွာကို တစ်ပြိုင်နက်အသုံးပြုသောအခါတွင် ၎င်းတို့ကို ပေါင်းစပ်၍မရသော်လည်း၊ ဆော့ဖ်ဝဲရေးသားသူသည် အမှားတစ်ခုပြုလုပ်ခဲ့ပြီး ၎င်းကို သင်ရှောင်ထွက်သွားခဲ့သည်။ စည်းမျဉ်းများအရ α ၏တန်ဖိုးသည် 0,05/2 = 0,025 ဟူသော သာလွန်သီအိုရီကို စမ်းသပ်ရာတွင် အသုံးပြုသည့် α တန်ဖိုးတစ်ဝက်နှင့် ညီမျှသင့်သည်။

နမူနာအရွယ်အစား

နမူနာအရွယ်အစားကို ဘယ်လို ခန့်မှန်းရမလဲ။ A နှင့် B အကြား စစ်မှန်သော ပျမ်းမျှ ခြားနားချက်သည် 0 ဖြစ်သည်ဟု သင်ယုံကြည်ပါက၊ နမူနာအရွယ်အစား တွက်ချက်မှုသည် သာလွန်မှုယူဆချက်အား သင်အသုံးပြုသည့် အကျိုးသက်ရောက်မှုအရွယ်အစားကို သိမ်ငယ်မှုမဟုတ်သောအနားသတ်ဖြင့် အစားထိုးခြင်းမှအပ၊ နမူနာအရွယ်အစား တွက်ချက်မှုသည် သာလွန်မှုယူဆချက်ကို စမ်းသပ်သောအခါနှင့် အတူတူပင်ဖြစ်ပါသည်။ αnon-ယုတ်ညံ့ထိရောက်မှု = 1/2α သာလွန်ကောင်းမွန်မှု (αnon-inferiority=1/2α သာလွန်မှု)။ ရွေးချယ်စရာ B သည် ရွေးစရာ A ထက် အနည်းငယ် ပိုဆိုးနိုင်သည်ဟု ယုံကြည်ရန် အကြောင်းပြချက်ရှိပါက၊ သို့သော် ၎င်းသည် Δ ထက် မပိုဘဲ ပိုဆိုးကြောင်း သက်သေပြလိုလျှင် သင်သည် ကံကောင်းပါသည်။ ညီမျှခြင်းထက် အနည်းငယ်ပိုဆိုးသည်ဟု အမှန်တကယ်ထင်ပါက B သည် A ထက် ပိုဆိုးကြောင်း သရုပ်ပြရန် ပိုမိုလွယ်ကူသောကြောင့် ၎င်းသည် သင်၏နမူနာအရွယ်အစားကို အမှန်တကယ် လျှော့ချပေးသည်။

ဖြေရှင်းချက်နှင့်အတူဥပမာ

0,1-point ဖောက်သည်ကျေနပ်မှုစကေးတွင် ဗားရှင်း A ထက် 5 မှတ်ထက် ပိုဆိုးမနေဘဲ ဗားရှင်း B သို့ အဆင့်မြှင့်လိုသည်ဆိုပါစို့... သာလွန်မှုသဘောတရားကို အသုံးပြု၍ ဤပြဿနာကို ချဉ်းကပ်ကြည့်ကြပါစို့။

သာလွန်ကောင်းမွန်မှု သဘောတရားကို စမ်းသပ်ရန်အတွက် နမူနာအရွယ်အစားကို အောက်ပါအတိုင်း တွက်ချက်ပါမည်။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

ဆိုလိုသည်မှာ သင့်တွင် သင့်တွင် လေ့လာတွေ့ရှိချက်ပေါင်း 2103 ခုရှိပါက၊ သင်သည် အကျိုးသက်ရောက်မှုအရွယ်အစား 90 သို့မဟုတ် ထို့ထက်ပိုကြီးသည်ကို 0,10% ယုံကြည်နိုင်ပါသည်။ သို့သော် 0,10 သည် သင့်အတွက် မြင့်မားနေပါက၊ ၎င်းသည် သာလွန်မှုသဘောတရားကို စမ်းသပ်ရန် မထိုက်တန်ပါ။ ဘေးကင်းစေရန်အတွက်၊ 0,05 ကဲ့သို့သော သေးငယ်သောအကျိုးသက်ရောက်မှုအရွယ်အစားအတွက် လေ့လာမှုအား လုပ်ဆောင်ရန် သင်ဆုံးဖြတ်နိုင်သည်။ ဤကိစ္စတွင်၊ သင်သည် 8407 လေ့လာတွေ့ရှိချက်လိုအပ်လိမ့်မည်၊ ဆိုလိုသည်မှာနမူနာသည် 4 ဆနီးပါးတိုးလာလိမ့်မည်။ ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏မူလနမူနာအရွယ်အစားတွင် ကပ်ထားသော်လည်း 0,99 သို့ ပါဝါတိုးလာပါက ကျွန်ုပ်တို့သည် အပြုသဘောဆောင်သောရလဒ်ရရှိပါက ကျွန်ုပ်တို့ ဘေးကင်းနိုင်မည်ဖြစ်သည်။ ဤကိစ္စတွင်၊ အုပ်စုတစ်စုအတွက် n သည် 3676 ဖြစ်လိမ့်မည်၊ ၎င်းသည် ပိုကောင်းနေပြီဖြစ်သော်လည်း နမူနာအရွယ်အစားကို 50% ထက် ပိုတိုးစေသည်။ ရလဒ်အနေဖြင့်၊ ကျွန်ုပ်တို့သည် null hypothesis ကို ရိုးရှင်းစွာ ချေပနိုင်မည်မဟုတ်သေးဘဲ၊ ကျွန်ုပ်တို့၏မေးခွန်းအတွက် အဖြေကို ရရှိလိမ့်မည်မဟုတ်ပေ။

အဲဒီအစား သိမ်ငယ်စိတ်မရှိသော ယူဆချက်ကို စမ်းသပ်ကြည့်လျှင်ကော။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

နမူနာအရွယ်အစားကို ပိုင်းခြေမှလွဲ၍ တူညီသောဖော်မြူလာဖြင့် တွက်ချက်ပါမည်။
သာလွန်မှု အယူအဆကို စမ်းသပ်ရန် အသုံးပြုသည့် ဖော်မြူလာမှ ကွဲလွဲချက်များမှာ အောက်ပါအတိုင်း ဖြစ်သည်။

— Z1−α/2 ကို Z1−α ဖြင့် အစားထိုးသည်၊ သို့သော် အကယ်၍ သင်သည် စည်းမျဉ်းများနှင့်အညီ အရာအားလုံးကို လုပ်ဆောင်ပါက သင်သည် α = 0,05 ကို α = 0,025 ဖြင့် အစားထိုးသည်၊ ဆိုလိုသည်မှာ ၎င်းသည် တူညီသောနံပါတ် (1,96) ဖြစ်သည်။

— (μB−μA) ပိုင်းခြေတွင် ပေါ်လာသည်။

— θ (အကျိုးသက်ရောက်မှုအရွယ်အစား) ကို Δ (သိမ်ငယ်မှုမရှိသောအနားသတ်) ဖြင့် အစားထိုးသည်။

µB = µA ဟုကျွန်ုပ်တို့ယူဆပါက (µB − µA) = 0 နှင့် သိမ်ငယ်မှုမရှိသောအနားသတ်အတွက်နမူနာအရွယ်အစားတွက်ချက်မှုသည် 0,1 အကျိုးသက်ရောက်မှုအရွယ်အစားအတွက်သာလွန်မှုကိုတွက်ချက်ပါကကျွန်ုပ်တို့ရရှိမည့်အရာအတိအကျဖြစ်သည်။ မတူညီသော ယူဆချက်များနှင့် ကောက်ချက်ချရန်အတွက် ကွဲပြားခြားနားသော ချဉ်းကပ်မှုဖြင့် တူညီသောအရွယ်အစားကို လေ့လာမှုတစ်ခု ပြုလုပ်နိုင်ပြီး ကျွန်ုပ်တို့ အမှန်တကယ်ဖြေဆိုလိုသော မေးခွန်းအတွက် အဖြေကို ရရှိမည်ဖြစ်သည်။

ယခု ကျွန်ုပ်တို့သည် µB = µA နှင့် µB ကို အမှန်တကယ် မထင်မှတ်ထားဟု ဆိုပါစို့
µB သည် အနည်းငယ်ပိုဆိုးသည်ဟု ကျွန်ုပ်တို့ထင်သည်၊ 0,01 ယူနစ်ဖြင့် ဖြစ်နိုင်သည်။ ၎င်းသည် ကျွန်ုပ်တို့၏ ပိုင်းခြေကို တိုးစေပြီး အုပ်စုတစ်ခုလျှင် နမူနာအရွယ်အစားကို 1737 သို့ လျှော့ချသည်။

ဗားရှင်း B သည် ဗားရှင်း A ထက် အမှန်တကယ် ကောင်းမွန်ပါက မည်သို့ဖြစ်မည်နည်း။ B သည် Δ ထက် ပိုဆိုးသည်ဟူသော null hypothesis ကို ကျွန်ုပ်တို့ ငြင်းပယ်ပြီး B သည် ပိုဆိုးပါက A ထက် Δ ထက် ပိုမဆိုးဘဲ ပိုကောင်းနိုင်သည်ဟူသော အခြားယူဆချက်တစ်ခုကို လက်ခံပါသည်။ ဤနိဂုံးချုပ်ချက်ကို ပေါင်းစပ်လုပ်ဆောင်နိုင်သော တင်ဆက်မှုတစ်ခုတွင် ထည့်သွင်းကြည့်ပါက ဘာဖြစ်မည်ကို ကြည့်ပါ (အလေးအနက်ထားပြီး ကြိုးစားကြည့်ပါ)။ ရှေ့ရှုသောအခြေအနေတွင်၊ မည်သူမျှ "Δ ထက် ပိုဆိုးပြီး ပိုကောင်းနိုင်သည်" အတွက် အခြေချလိုခြင်းမရှိပါ။

ဤကိစ္စတွင်၊ ကျွန်ုပ်တို့သည် “ရွေးချယ်စရာများထဲမှ တစ်ခုသည် အခြားတစ်ခုထက် သာလွန်သည် သို့မဟုတ် ယုတ်ညံ့သည်ဟူသော ယူဆချက်ကို စမ်းသပ်ခြင်း” ဟု အတိုချုံးခေါ်သည့် လေ့လာမှုတစ်ခု ပြုလုပ်နိုင်သည်။ ၎င်းသည် ယူဆချက်နှစ်ခုကို အသုံးပြုသည်-

ပထမအဆင့် (သိမ်ငယ်မှုမရှိသော ယူဆချက်အား စမ်းသပ်ခြင်းနှင့် အတူတူ)။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

ဒုတိယအစု (သာလွန်မှု အယူအဆကို စမ်းသပ်ရာတွင် အတူတူပင်)။

သိမ်ငယ်မှုမရှိသော ယူဆချက်အား မည်သည့်အချိန်တွင် စမ်းသပ်သင့်သနည်း။

ပထမတစ်ခုကို ပယ်ချမှသာ ဒုတိယယူဆချက်ကို ကျွန်ုပ်တို့ စမ်းသပ်သည်။ ဆက်တိုက်စမ်းသပ်သောအခါ၊ ကျွန်ုပ်တို့သည် Type I အမှားအယွင်းနှုန်း (α) ကို ထိန်းသိမ်းထားသည်။ လက်တွေ့တွင်၊ ကြားကာလတစ်ခုလုံးသည် -Δ ထက်ကြီးသည်ရှိမရှိ ဆုံးဖြတ်ရန် နည်းလမ်းများနှင့် စမ်းသပ်မှုကြားခြားနားချက်အတွက် 95% ယုံကြည်မှုကြားကာလကို ဖန်တီးခြင်းဖြင့် ၎င်းကို အောင်မြင်နိုင်သည်။ ကြားကာလသည် -Δ ထက်မကျော်လွန်ပါက၊ ကျွန်ုပ်တို့သည် null တန်ဖိုးကို ငြင်းပယ်ပြီး ရပ်တန့်နိုင်မည်မဟုတ်ပါ။ ကြားကာလတစ်ခုလုံးသည် −Δ ထက် အမှန်တကယ်ကြီးမားပါက၊ ကျွန်ုပ်တို့သည် ဆက်လက်၍ ကြားကာလတွင် 0 ပါဝင်ခြင်းရှိမရှိ ကြည့်ရှုပါမည်။

ကျွန်ုပ်တို့မဆွေးနွေးရသေးသော အခြားသုတေသနအမျိုးအစားတစ်ခုရှိပါသည် - ညီမျှခြင်းလေ့လာမှုများ။

ဤလေ့လာမှုအမျိုးအစားများကို သိမ်ငယ်မှုမရှိသောလေ့လာမှုများနှင့် အပြန်အလှန်အားဖြင့် အစားထိုးနိုင်သော်လည်း အမှန်တကယ်တွင် ၎င်းတို့တွင် အရေးကြီးသောကွာခြားချက်ရှိသည်။ နိမ့်ကျမှုမရှိသောစမ်းသပ်မှုတစ်ခုသည် ရွေးချယ်မှု B သည် အနည်းဆုံး A ကဲ့သို့ ကောင်းမွန်ကြောင်းပြသရန် ရည်ရွယ်သည်။ ညီမျှသောစမ်းသပ်မှုတစ်ခုသည် ရွေးချယ်မှု B သည် အနည်းဆုံး A ကဲ့သို့ ကောင်းမွန်ကြောင်းပြသရန် ရည်ရွယ်သည်။ ရွေးချယ်မှု A သည် B ကဲ့သို့ ကောင်းမွန်သည်၊ ၎င်းသည် ပို၍ခက်ခဲသည်။ အခြေခံအားဖြင့်၊ ကျွန်ုပ်တို့သည် ယုံကြည်စိတ်ချမှုကြားကာလတစ်ခုလုံးကို ဆိုလိုသည်မှာ −Δ နှင့် Δ အကြားရှိမရှိ ဆုံးဖြတ်ရန် ကြိုးစားနေပါသည်။ ထိုသို့သောလေ့လာမှုများသည် ပိုကြီးသောနမူနာအရွယ်အစား လိုအပ်ပြီး မကြာခဏပြုလုပ်လေ့ရှိသည်။ ထို့ကြောင့် ဗားရှင်းအသစ်သည် ပိုမိုဆိုးရွားခြင်းမရှိကြောင်း သေချာစေရန် သင်၏အဓိကပန်းတိုင်ဖြစ်သော လေ့လာမှုတစ်ခုကို နောက်တစ်ကြိမ်ပြုလုပ်သည့်အခါတွင်၊ " null hypothesis ကို ငြင်းပယ်ရန်ပျက်ကွက်ခြင်း" အတွက် အတည်တကျမလုပ်ပါနှင့်။ အမှန်တကယ်အရေးကြီးသော ယူဆချက်တစ်ခုကို စမ်းသပ်လိုပါက မတူညီသော ရွေးချယ်မှုများကို စဉ်းစားပါ။

source: www.habr.com

မှတ်ချက် Add