අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?
Stitch Fix කණ්ඩායමේ ලිපියක් අලෙවිකරණය සහ නිෂ්පාදන A/B පරීක්ෂා කිරීමේදී පහත් නොවන අත්හදා බැලීම් ප්‍රවේශයක් භාවිතා කිරීමට යෝජනා කරයි. පරීක්ෂණ මගින් මැනිය නොහැකි ප්‍රතිලාභ ඇති නව විසඳුමක් අප පරීක්ෂා කරන විට මෙම ප්‍රවේශය සැබවින්ම අදාළ වේ.

සරලම උදාහරණය අස්ථි නැතිවීමයි. උදාහරණයක් ලෙස, අපි පළමු පාඩම පැවරීමේ ක්‍රියාවලිය ස්වයංක්‍රීය කරමු, නමුත් අපට අවසානය දක්වා පරිවර්තනය ඕනෑවට වඩා අතහැරීමට අවශ්‍ය නැත. එසේත් නැතිනම් අපි පරිශීලකයින්ගේ එක් කොටසකට අවධානය යොමු කරන වෙනස්කම් පරීක්ෂා කරන අතරම, අනෙක් කොටස් සඳහා වන පරිවර්තන බොහෝ සෙයින් ගිලිහී නොයන බවට වග බලා ගන්න (උපකල්පන කිහිපයක් පරීක්ෂා කිරීමේදී, නිවැරදි කිරීම් ගැන අමතක නොකරන්න).

නිවැරදි පහත් නොවන බැඳීම තෝරා ගැනීම පරීක්ෂණ සැලසුම් අවධියේදී අමතර අභියෝග එකතු කරයි. Δ තෝරා ගන්නේ කෙසේද යන ප්‍රශ්නය ලිපියේ හොඳින් ආවරණය වී නොමැත. මෙම තේරීම සායනික අත්හදා බැලීම් වලදී ද සම්පූර්ණයෙන්ම විනිවිද පෙනෙන නොවන බව පෙනේ. දළ විශ්ලේෂණය ප්‍රකාශනවලින් අඩක් පමණක් සීමා තේරීම සාධාරණීකරණය කරන අතර බොහෝ විට මෙම සාධාරණීකරණයන් අපැහැදිලි හෝ සවිස්තරාත්මක නොවේ.

ඕනෑම අවස්ථාවක, මෙම ප්රවේශය රසවත් බව පෙනේ අවශ්‍ය නියැදි ප්‍රමාණය අඩු කිරීමෙන්, එය පරීක්ෂා කිරීමේ වේගය වැඩි කළ හැකි අතර, එබැවින්, තීරණ ගැනීමේ වේගය. - ඩාරියා මුඛිනා, Skyeng ජංගම යෙදුම සඳහා නිෂ්පාදන විශ්ලේෂක.

Stitch Fix කණ්ඩායම විවිධ දේවල් පරීක්ෂා කිරීමට කැමතියි. සමස්ත තාක්ෂණ ප්රජාව මූලික වශයෙන් පරීක්ෂණ ධාවනය කිරීමට කැමතියි. වෙබ් අඩවියේ කුමන අනුවාදය වැඩි පරිශීලකයින් ආකර්ෂණය කරයි - A හෝ B? නිර්දේශිත ආකෘතියේ A අනුවාදය B අනුවාදයට වඩා වැඩි මුදලක් උපයන්නේද? සෑම විටම පාහේ, උපකල්පන පරීක්ෂා කිරීම සඳහා, අපි මූලික සංඛ්යාලේඛන පාඨමාලාවේ සරලම ප්රවේශය භාවිතා කරමු:

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

අප මෙම යෙදුම භාවිතා කරන්නේ කලාතුරකිනි, මෙම පරීක්ෂණ ක්‍රමය හඳුන්වන්නේ "උසස් බව පිළිබඳ උපකල්පනය පරීක්ෂා කිරීම" ලෙසිනි. මෙම ප්රවේශය සමඟ, විකල්ප දෙක අතර වෙනසක් නොමැති බව අපි උපකල්පනය කරමු. අපි මෙම අදහස සමඟ රැඳී සිටින අතර එය අත්හරින්නේ සොයාගැනීම් සහතික කිරීමට තරම් ඒත්තු ගැන්වෙන්නේ නම් පමණි - එනම්, එක් විකල්පයක් (A හෝ B) අනෙක් විකල්පයට වඩා හොඳ බව පෙන්නුම් කරයි.

උසස් උපකල්පන පරීක්ෂණය විවිධ ගැටළු විසඳීම සඳහා සුදුසු වේ. අපි නිර්දේශ කරන්නාගේ ආකෘතියේ B අනුවාදය නිකුත් කරන්නේ එය දැනටමත් භාවිතා කරන A අනුවාදයට වඩා පැහැදිලිවම හොඳ නම් පමණි.නමුත් සමහර අවස්ථාවලදී මෙම ප්‍රවේශය එතරම් හොඳින් ක්‍රියාත්මක නොවේ. අපි උදාහරණ කිහිපයක් බලමු.

1) අපි තෙවන පාර්ශවීය සේවාවක් භාවිතා කරමු, ව්යාජ බැංකු කාඩ්පත් හඳුනා ගැනීමට උපකාරී වේ. සැලකිය යුතු ලෙස අඩු පිරිවැයක් සහිත තවත් සේවාවක් අපට හමු විය. අපි දැනට භාවිතා කරන සේවාව මෙන්ම මිල අඩු සේවාවක් ක්‍රියාත්මක වන්නේ නම්, අපි එය තෝරා ගනිමු. එය ඔබ භාවිතා කරන සේවාවට වඩා හොඳ විය යුතු නැත.

2) අපට දත්ත මූලාශ්‍රය අතහැරීමට අවශ්‍යයි A සහ එය B දත්ත මූලාශ්‍රය සමඟ ප්‍රතිස්ථාපනය කරන්න. B ඉතා නරක ප්‍රතිඵල ඇති කරන්නේ නම් අපට A අත්හැරීම ප්‍රමාද කළ හැක, නමුත් A භාවිතා කිරීම දිගටම කළ නොහැක.

3) අපි ආකෘති නිර්මාණ ප්‍රවේශයකින් ඉවත් වීමට කැමැත්තෙමුA සිට B දක්වා ප්‍රවේශය, අපි B වෙතින් වඩා හොඳ ප්‍රතිඵල අපේක්ෂා කරන නිසා නොව, එය අපට වඩාත් ක්‍රියාකාරී නම්‍යශීලී බවක් ලබා දෙන බැවිනි. B නරක අතට හැරෙනු ඇතැයි විශ්වාස කිරීමට අපට කිසිදු හේතුවක් නැත, නමුත් එය එසේ වුවහොත් අපි සංක්‍රමණය නොවනු ඇත.

4) අපි ගුණාත්මක වෙනස්කම් කිහිපයක් සිදු කර ඇත වෙබ් අඩවි නිර්මාණය (අනුවාදය B) සහ මෙම අනුවාදය A අනුවාදයට වඩා උසස් බව විශ්වාස කරන්න. අපි සාමාන්‍යයෙන් වෙබ් අඩවියක් මනින පරිවර්තනවල හෝ KPI වල කිසිදු වෙනසක් අපේක්ෂා නොකරමු. නමුත් අප විශ්වාස කරන්නේ පරාමිතිවල ඇති වාසි මැනිය නොහැකි හෝ අපගේ තාක්ෂණය මැනීමට ප්‍රමාණවත් නොවන බවයි.

මේ සෑම අවස්ථාවකදීම විශිෂ්ටතා පර්යේෂණ හොඳම විසඳුම නොවේ. නමුත් එවැනි තත්වයන් තුළ බොහෝ විශේෂඥයින් එය පෙරනිමියෙන් භාවිතා කරයි. බලපෑමේ විශාලත්වය නිවැරදිව තීරණය කිරීම සඳහා අපි ප්රවේශමෙන් අත්හදා බැලීම සිදු කරන්නෙමු. A සහ B අනුවාද ඉතා සමාන ආකාරවලින් ක්‍රියා කරන බව සත්‍ය නම්, ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප කිරීමට අපට නොහැකි වනු ඇත. A සහ B සාමාන්‍යයෙන් එකම ආකාරයට ක්‍රියා කරන බව අපි නිගමනය කරමුද? නැත! ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප කිරීමට අසමත් වීම සහ ශුන්‍ය කල්පිතය පිළිගැනීම එකම දෙයක් නොවේ.

නියැදි ප්‍රමාණය ගණනය කිරීම් (ඇත්ත වශයෙන්ම, ඔබ විසින් සිදු කර ඇති) II වර්ගයේ දෝෂයට වඩා (ශුන්‍ය උපකල්පනය වැරදි ලෙස ප්‍රතික්ෂේප කිරීමේ සම්භාවිතාව, බොහෝ විට ඇල්ෆා ලෙස හඳුන්වන) Type I දෝෂය (null එක ප්‍රතික්ෂේප කිරීමට අපොහොසත් වීමේ සම්භාවිතාව) මත දැඩි සීමාවන් ඇත. උපකල්පනය, ශුන්‍ය කල්පිතය අසත්‍ය බව ලබා දී ඇති කොන්දේසිය, බොහෝ විට බීටා ලෙස හැඳින්වේ). ඇල්ෆා සඳහා සාමාන්‍ය අගය 0,05 වන අතර බීටා සඳහා සාමාන්‍ය අගය 0,20 වන අතර එය සංඛ්‍යාන බලය 0,80 ට අනුරූප වේ. මෙයින් අදහස් කරන්නේ 20% ක සම්භාවිතාවක් සහිතව අපගේ බල ගණනය කිරීම් වලදී අප පෙන්වා දුන් අගයේ සැබෑ බලපෑම අපට අනාවරණය නොවිය හැකි අතර මෙය තොරතුරු වල තරමක් බරපතල පරතරයකි. උදාහරණයක් ලෙස, පහත උපකල්පන සලකා බලමු:

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

H0: මගේ බෑගය මගේ කාමරයේ නැත (3)
H1: මගේ බෑගය මගේ කාමරයේ ඇත (4)

මම මගේ කාමරය සොයාගෙන මගේ බෑගය සොයා ගත්තොත්, විශිෂ්ටයි, මට ශුන්‍ය උපකල්පනය අතහරින්න පුළුවන්. නමුත් මම කාමරය වටා බැලූ විට මගේ බෑගය සොයාගත නොහැකි නම් (රූපය 1), මා ගත යුතු නිගමනය කුමක්ද? එය එහි නොමැති බව මට විශ්වාසද? මම හොඳටම හොයල බැලුවද? මම කාමරයෙන් 80%ක් පමණක් සෙව්වොත්? අනිවාර්යයෙන්ම කාමරයේ බෑගයක් නොමැති බව නිගමනය කිරීම හදිසි තීරණයක් වනු ඇත. අපට "ශුන්‍ය උපකල්පනය" පිළිගත නොහැකි වීම පුදුමයක් නොවේ.
අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?
අපි සෙවූ ප්‍රදේශය
අපි බෑගය සොයා ගත්තේ නැත - අපි ශුන්‍ය උපකල්පනය පිළිගත යුතුද?

රූපය 1. කාමරයක 80%ක් සෙවීම 80% බලයෙන් සෙවීමක් කිරීමට සමාන වේ. කාමරයෙන් 80% ක් පමණ බැලූ පසු ඔබට බෑගයක් හමු නොවූයේ නම්, එය එහි නොමැති බව ඔබට නිගමනය කළ හැකිද?

ඉතින් මේ තත්ත්වය තුළ දත්ත විද්‍යාඥයකු කළ යුත්තේ කුමක්ද? ඔබට අධ්‍යයනයේ බලය බෙහෙවින් වැඩි කළ හැකි නමුත්, එවිට ඔබට වඩා විශාල නියැදි ප්‍රමාණයක් අවශ්‍ය වනු ඇත, ප්‍රති result ලය තවමත් අසතුටුදායක වනු ඇත.

වාසනාවකට මෙන්, එවැනි ගැටළු සායනික පර්යේෂණ ලෝකයේ දීර්ඝ කාලයක් තිස්සේ අධ්යයනය කර ඇත. B ඖෂධය A ඖෂධයට වඩා ලාභදායී වේ; ඖෂධ B ඖෂධය A ඖෂධයට වඩා අඩු අතුරු ආබාධ ඇති කිරීමට අපේක්ෂා කෙරේ; B drug ෂධය ප්‍රවාහනය කිරීමට පහසු වන්නේ එය ශීතකරණය කිරීමට අවශ්‍ය නොවන නමුත් A ඖෂධය ප්‍රවාහනය කරන බැවිනි. පහත් නොවන කල්පිතය පරීක්ෂා කරමු. මෙය B අනුවාදය A අනුවාදය තරම්ම හොඳ බව පෙන්වීමට ය-අවම වශයෙන් කලින් තීරණය කළ "අඩු නොවන කාර්යක්ෂම" සීමාවක් තුළ, Δ. මෙම සීමාව සකසන්නේ කෙසේද යන්න ගැන අපි ටිකක් පසුව කතා කරමු. නමුත් දැනට, මෙය ප්‍රායෝගිකව වැදගත් වන අවම වෙනස යැයි උපකල්පනය කරමු (සායනික අත්හදා බැලීම්වල සන්දර්භය තුළ, මෙය සාමාන්‍යයෙන් සායනික වැදගත්කම ලෙස හැඳින්වේ).

අඩු කාර්යක්ෂමතාවයක් පිළිබඳ උපකල්පන සියල්ල උඩු යටිකුරු කරයි:

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

දැන්, වෙනසක් නැතැයි උපකල්පනය කරනවා වෙනුවට, අපි අනුමාන කරන්නේ B අනුවාදය A අනුවාදයට වඩා නරක බවයි, එය එසේ නොවන බව පෙන්නුම් කරන තෙක් අපි මෙම උපකල්පනයට ඇලී සිටිමු. ඒකපාර්ශ්වික උපකල්පන පරීක්ෂාව භාවිතා කිරීම අර්ථවත් වන විට මෙය හරියටම කාරණයයි! ප්‍රායෝගිකව, විශ්වාස අන්තරයක් ගොඩ නැගීමෙන් සහ අන්තරය ඇත්ත වශයෙන්ම Δ ට වඩා වැඩිද යන්න තීරණය කිරීමෙන් මෙය කළ හැක (රූපය 2).
අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

තේරීම Δ

නිවැරදි Δ තෝරා ගන්නේ කෙසේද? Δ තෝරාගැනීමේ ක්‍රියාවලියට සංඛ්‍යානමය සාධාරණීකරණය සහ සාරභූත ඇගයීම ඇතුළත් වේ. සායනික පර්යේෂණ ලෝකයේ, ඩෙල්ටා කුඩාම සායනික වශයෙන් වැදගත් වෙනස විය යුතු බව යෝජනා කරන සම්මත මාර්ගෝපදේශ ඇත - එය ප්‍රායෝගිකව වැදගත් වනු ඇත. මෙන්න ඔබම පරීක්‍ෂා කර ගැනීමට යුරෝපීය අත්පොතෙන් උපුටා ගැනීමකි: “වෙනස නිවැරදිව තෝරාගෙන තිබේ නම්, සම්පූර්ණයෙන්ම -∆ සහ 0... අතර පවතින විශ්වාස අන්තරයක් අඩු කාර්යක්ෂමතාවයක් පෙන්නුම් කිරීමට තවමත් ප්‍රමාණවත් වේ. මෙම ප්‍රතිඵලය පිළිගත නොහැකි බව පෙනේ නම්, එයින් අදහස් වන්නේ ∆ සුදුසු පරිදි තෝරා නොගත් බවයි.”

සත්‍ය පාලනයට (ප්ලේසෙබෝ/ප්‍රතිකාර නොමැතිව) සාපේක්ෂව ඩෙල්ටාව නියත වශයෙන්ම A අනුවාදයේ ප්‍රයෝග ප්‍රමාණය නොඉක්මවිය යුතුය, මෙය B අනුවාදය සත්‍ය පාලනයට වඩා නරක බවත්, ඒ සමඟම "අඩු කාර්යක්ෂමතාවයක් නොමැති බවත්" නිගමනය කිරීමට අපව යොමු කරයි. ". A අනුවාදය හඳුන්වා දුන් විට, 0 අනුවාදය එහි ස්ථානයේ තිබුනා යැයි සිතමු, නැතහොත් විශේෂාංගය කිසිසේත්ම නොතිබුණි (රූපය 3 බලන්න).

උසස් බව පිළිබඳ කල්පිතය පරීක්‍ෂා කිරීමේ ප්‍රතිඵල මත පදනම්ව, බලපෑමේ ප්‍රමාණය E අනාවරණය විය (එනම්, අනුමාන වශයෙන් μ^A−μ^0=E). දැන් A අපගේ නව ප්‍රමිතිය වන අතර, B යනු A තරම් හොඳ බව තහවුරු කර ගැනීමට අපට අවශ්‍යය. μB−μA≤−Δ (ශුන්‍ය උපකල්පනය) ලිවීමට තවත් ක්‍රමයක් වන්නේ μB≤μA−Δ වේ. අපි කරන්නේ E ට සමාන හෝ වැඩි යැයි උපකල්පනය කරන්නේ නම්, μB ≤ μA−E ≤ placebo. දැන් අපට පෙනෙන්නේ μB සඳහා වන අපගේ ඇස්තමේන්තුව μA−E ට වඩා සම්පූර්ණයෙන්ම වැඩි වන අතර එමඟින් ශුන්‍ය කල්පිතය සම්පූර්ණයෙන්ම ප්‍රතික්ෂේප කරන අතර B A ට වඩා පහත් නොවන බව නිගමනය කිරීමට අපට ඉඩ සලසයි, නමුත් ඒ සමඟම, μB ≤ μ placebo විය හැකිය. අපට අවශ්‍ය දේ නොවේ. (රූපය 3).

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?
රූපය 3. අඩු කාර්යක්ෂමතාවයක් නොමැති මායිමක් තෝරාගැනීමේ අවදානම් නිරූපණය කිරීම. සීමාව ඉතා ඉහළ නම්, B A ට වඩා පහත් නොවන බව නිගමනය කළ හැකිය, නමුත් ඒ සමඟම ප්ලේසෙබෝ වලින් වෙන්කර හඳුනාගත නොහැකිය. ප්ලේසෙබෝ (A) ට වඩා පැහැදිලිවම ඵලදායී ඖෂධයක් අපි ප්ලේසෙබෝ තරම් ඵලදායී ඖෂධයක් සඳහා වෙනස් නොකරමු.

තේරීම α

අපි α හි තේරීම වෙත යමු. ඔබට සම්මත අගය α = 0,05 භාවිතා කළ හැකිය, නමුත් මෙය සම්පූර්ණයෙන්ම සාධාරණ නොවේ. උදාහරණයක් ලෙස, ඔබ අන්තර්ජාලයේ යමක් මිල දී ගෙන එකවර වට්ටම් කේත කිහිපයක් භාවිතා කරන විට, ඒවා එකතු නොකළ යුතු වුවද - සංවර්ධකයා වැරැද්දක් කර ඇති අතර ඔබ එයින් ගැලවී ඇත. රීති වලට අනුව, α හි අගය α හි අගයෙන් අඩකට සමාන විය යුතුය, එය උසස් කල්පිතය පරීක්ෂා කිරීමේදී භාවිතා වේ, එනම් 0,05 / 2 = 0,025.

සාම්පල ප්රමාණය

නියැදි ප්රමාණය තක්සේරු කරන්නේ කෙසේද? ඔබ A සහ ​​B අතර සත්‍ය මධ්‍යන්‍ය වෙනස 0 යැයි උපකල්පනය කරන්නේ නම්, නියැදි ප්‍රමාණය ගණනය කිරීම උසස් කල්පිත පරීක්ෂණයේ දී මෙන් ම වේ, ඔබ බලපෑමේ ප්‍රමාණය අඩු කාර්යක්ෂමතාවයකින් තොරව ප්‍රතිස්ථාපනය කිරීම හැර, ඔබ භාවිත α අඩු කාර්යක්ෂම නොවේ = 1/2 α උසස් (αnon-inferiority=1/2αsuperiority). B විකල්පය A විකල්පයට වඩා තරමක් නරක විය හැකි බව විශ්වාස කිරීමට ඔබට හේතුවක් තිබේ නම්, නමුත් එය Δ ට වඩා නරක නොවන බව ඔප්පු කිරීමට ඔබට අවශ්‍ය නම්, ඔබ වාසනාවන්තයි! ඇත්ත වශයෙන්ම, මෙය ඔබේ නියැදි ප්‍රමාණය අඩු කරයි, මන්ද ඔබ ඇත්තටම සිතන්නේ නම් එය සමාන නොවන තරමක් නරක යැයි ඔබ සිතන්නේ නම් A ට වඩා B නරක බව පෙන්වීමට පහසු වේ.

විසඳුම උදාහරණය

0,1-ලක්ෂ්‍ය පාරිභෝගික තෘප්තිමත් පරිමාණයෙන් A අනුවාදයට වඩා ලකුණු 5 ට වඩා නරක නම්, ඔබට B අනුවාදයට උත්ශ්‍රේණි කිරීමට අවශ්‍ය යැයි සිතමු... අපි මෙම ගැටලුවට උත්තරීතර කල්පිතය භාවිතයෙන් ප්‍රවේශ වෙමු.

උසස් කල්පිතය පරීක්ෂා කිරීම සඳහා, අපි නියැදි ප්රමාණය පහත පරිදි ගණනය කරමු:

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

එනම්, ඔබ කණ්ඩායමක් තුළ නිරීක්ෂණ 2103 ක් තිබේ නම්, ඔබ 90 හෝ ඊට වැඩි බලපෑමක් සොයා ගන්නා බවට 0,10% විශ්වාස කළ හැකිය. නමුත් 0,10 ඔබට වඩා වැඩි නම්, එය සඳහා සුපිරි කල්පිතය පරීක්ෂා කිරීම වටී නැත. 0,05 වැනි කුඩා ප්‍රයෝග ප්‍රමාණයකට අධ්‍යයනය ක්‍රියාත්මක කිරීමට ඔබට සහතික විය හැක. මෙම අවස්ථාවේදී, ඔබට නිරීක්ෂණ 8407 ක් අවශ්ය වනු ඇත, එනම්, නියැදිය 4 ගුණයකින් වැඩි වනු ඇත. නමුත් අපි අපගේ මුල් සාම්පල ප්‍රමාණයට ඇලී සිටියත් බලය 0,99 දක්වා වැඩි කළහොත් අපට ධනාත්මක ප්‍රති result ලයක් ලැබෙනු ඇත්දැයි සැක නොකරමු නම් කුමක් කළ යුතුද? මෙම අවස්ථාවෙහිදී, එක් කණ්ඩායමක් සඳහා n 3676 වනු ඇත, එය දැනටමත් වඩා හොඳය, නමුත් නියැදි ප්රමාණය 50% ට වඩා වැඩි කරයි. එහි ප්‍රතිඵලයක් වශයෙන්, අපට තවමත් ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප කිරීමට නොහැකි වනු ඇති අතර, අපගේ ප්‍රශ්නයට පිළිතුරක් අපට නොලැබෙනු ඇත.

ඒ වෙනුවට අපි අඩු කාර්යක්ෂමතාවයක් නොමැති කල්පිතය පරීක්ෂා කරන්නේ නම් කුමක් කළ යුතුද?

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

හරය හැර නියැදි ප්‍රමාණය එකම සූත්‍රය භාවිතයෙන් ගණනය කෙරේ.
උසස් කල්පිතය පරීක්ෂා කිරීමේදී භාවිතා කරන සූත්‍රයේ වෙනස්කම් පහත පරිදි වේ:

- Z1−α/2 වෙනුවට Z1−α, නමුත් ඔබ නීතිරීතිවලට අනුව සෑම දෙයක්ම කරන්නේ නම්, ඔබ α = 0,05 වෙනුවට α = 0,025, එනම් මෙය එකම අංකය (1,96)

- හරයෙන් දිස්වේ (μB−μA)

- θ (ඵල ප්‍රමාණය) Δ මගින් ප්‍රතිස්ථාපනය වේ (අඩු කාර්යක්ෂමතාවයේ සීමාව)

අපි උපකල්පනය කරන්නේ නම් µB = µA, එවිට (µB - µA) = 0 සහ පහත් නොවන ආන්තිකය සඳහා නියැදි ප්‍රමාණය ගණනය කිරීම 0,1 ක ප්‍රයෝග ප්‍රමාණය සඳහා උසස් බව ගණනය කිරීමේදී අපට ලැබෙන දේ හරියටම වේ, විශිෂ්ටයි! විවිධ උපකල්පන සහ නිගමනවලට වෙනස් ප්‍රවේශයක් සමඟ එකම පරිමාණයේ අධ්‍යයනයක් කළ හැකි අතර අපට සැබවින්ම පිළිතුරු දීමට අවශ්‍ය ප්‍රශ්නයට පිළිතුර අපට ලැබෙනු ඇත.

දැන් අපි හිතමු අපි ඇත්තටම µB = µA සහ කියලා විශ්වාස කරන්නේ නැහැ කියලා
අපි හිතන්නේ µB ටිකක් නරකයි, සමහර විට ඒකක 0,01 කින්. මෙය අපගේ හරය වැඩි කරයි, එක් කණ්ඩායමකට නියැදි ප්‍රමාණය 1737 දක්වා අඩු කරයි.

A අනුවාදයට වඩා B අනුවාදය ඇත්තෙන්ම හොඳ නම් කුමක් සිදුවේද? අපි ∆ට වඩා A ට වඩා නරකයි යන ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප කරන අතර B, නරක නම්, ∆ ට වඩා නරක නොවන අතර වඩා හොඳ විය හැකි විකල්ප කල්පිතය පිළිගනිමු. එම නිගමනය හරස් ක්‍රියාකාරී ඉදිරිපත් කිරීමකට දැමීමට උත්සාහ කර සිදුවන්නේ කුමක්දැයි බලන්න (බැරෑරුම් ලෙස, එය උත්සාහ කරන්න). ඔබ අනාගතයට නැඹුරු විය යුතු තත්වයක් තුළ, කිසිවෙකුට "Δ වඩා නරක සහ සමහර විට වඩා හොඳ" සඳහා පදිංචි වීමට අවශ්ය නැත.

මෙම අවස්ථාවෙහිදී, අපට ඉතා කෙටියෙන් හැඳින්වෙන අධ්‍යයනයක් පැවැත්විය හැකිය "විකල්ප වලින් එකක් අනෙකට වඩා උසස් හෝ පහත් බවට උපකල්පනය පරීක්ෂා කිරීම". එය උපකල්පන කට්ටල දෙකක් භාවිතා කරයි:

පළමු කට්ටලය (අඩු කාර්යක්ෂමතාවයේ කල්පිතය පරීක්ෂා කිරීමේදී සමාන වේ):

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

දෙවන කට්ටලය (සුපිරිතා කල්පිතය පරීක්ෂා කිරීමේදී සමාන):

අපි පහත් නොවන කල්පිතය පරීක්ෂා කළ යුත්තේ කවදාද?

අපි දෙවන උපකල්පනය පරීක්ෂා කරන්නේ පළමු එක ප්‍රතික්ෂේප කළහොත් පමණි. අනුක්‍රමික පරීක්ෂාවේදී, අපි සමස්ත මට්ටමේ I වර්ගයේ දෝෂ (α) තබා ගනිමු. ප්‍රායෝගිකව, මාධ්‍යයන් අතර වෙනස සඳහා 95% විශ්වාසනීය පරතරයක් නිර්මාණය කිරීමෙන් සහ සම්පූර්ණ පරතරය -Δ ට වඩා වැඩි දැයි පරීක්ෂා කිරීමෙන් මෙය සාක්ෂාත් කරගත හැකිය. පරතරය -Δ නොඉක්මවන්නේ නම්, අපට ශුන්‍ය අගය ප්‍රතික්ෂේප කර නැවැත්විය නොහැක. සම්පූර්ණ පරතරය ඇත්ත වශයෙන්ම -Δ ට වඩා වැඩි නම්, අපි ඉදිරියට ගොස් විරාමයේ 0 අඩංගු දැයි බලමු.

අප සාකච්ඡා නොකළ තවත් පර්යේෂණ වර්ගයක් තිබේ - සමානතා අධ්‍යයනය.

මෙම වර්ගයේ අධ්‍යයනයන් නොඅඩු කාර්යක්ෂමතාවයේ උපකල්පනය පරීක්ෂා කිරීම සඳහා අධ්‍යයන මගින් ප්‍රතිස්ථාපනය කළ හැකි අතර අනෙක් අතට, නමුත් ඒවාටම වැදගත් වෙනසක් ඇත. පහත් නොවන පරීක්ෂණයකින් අරමුණු වන්නේ B විකල්පය අවම වශයෙන් A තරම් හොඳ බව පෙන්වීමයි. සමානතා අධ්‍යයනයකින් අරමුණු කරන්නේ B විකල්පය අවම වශයෙන් A තරම් හොඳ බව පෙන්වීම සහ A විකල්පය B තරම්ම හොඳ බව පෙන්වීමයි, එය වඩා දුෂ්කර ය. . සාරාංශයක් ලෙස, අපි උත්සාහ කරන්නේ මාධ්‍යයන් අතර වෙනස සඳහා සම්පූර්ණ විශ්වාසනීය පරතරය -∆ සහ ∆ අතර පවතින්නේද යන්න තීරණය කිරීමටයි. එවැනි අධ්‍යයනයන්ට විශාල නියැදි ප්‍රමාණ අවශ්‍ය වන අතර අඩුවෙන් සිදු කරනු ලැබේ. එබැවින් ඔබ මීළඟ වතාවේ අධ්‍යයනයක් කරන විට ඔබේ ප්‍රධාන සැලකිල්ල නව අනුවාදය තරම් හොඳ බව සහතික කර ගැනීම, "ශුන්‍ය කල්පිතය අසත්‍ය වීම" සඳහා විසඳා නොගන්න. ඔබට සැබවින්ම වැදගත් උපකල්පනයක් පරීක්ෂා කිරීමට අවශ්‍ය නම්, විවිධ විකල්ප සලකා බලන්න.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න