నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?
స్టిచ్ ఫిక్స్ బృందం నుండి వచ్చిన ఒక కథనం మార్కెటింగ్ మరియు ఉత్పత్తి A/B పరీక్షలలో నాన్-ఇన్‌ఫీరియారిటీ ట్రయల్స్ విధానాన్ని ఉపయోగించాలని సూచించింది. మేము పరీక్షల ద్వారా కొలవబడని ప్రయోజనాలను కలిగి ఉన్న కొత్త పరిష్కారాన్ని పరీక్షిస్తున్నప్పుడు ఈ విధానం నిజంగా వర్తిస్తుంది.

సరళమైన ఉదాహరణ ఖర్చు తగ్గింపు. ఉదాహరణకు, మేము మొదటి పాఠాన్ని కేటాయించే ప్రక్రియను ఆటోమేట్ చేస్తాము, కానీ మేము ఎండ్-టు-ఎండ్ మార్పిడిని గణనీయంగా తగ్గించాలనుకోవడం లేదు. లేదా మేము వినియోగదారుల యొక్క ఒక విభాగాన్ని లక్ష్యంగా చేసుకున్న మార్పులను పరీక్షిస్తాము, ఇతర విభాగాల కోసం మార్పిడులు ఎక్కువగా తగ్గకుండా చూసుకుంటాము (అనేక పరికల్పనలను పరీక్షించేటప్పుడు, సవరణల గురించి మర్చిపోవద్దు).

సరైన నాన్-ఇన్‌ఫీరియారిటీ మార్జిన్‌ని ఎంచుకోవడం పరీక్ష రూపకల్పన దశలో అదనపు సవాళ్లను జోడిస్తుంది. Δ ఎలా ఎంచుకోవాలి అనే ప్రశ్న వ్యాసంలో బాగా లేదు. క్లినికల్ ట్రయల్స్‌లో కూడా ఈ ఎంపిక పూర్తిగా పారదర్శకంగా లేదని తెలుస్తోంది. పర్యావలోకనం నాన్-ఇన్‌ఫీరియారిటీపై మెడికల్ పబ్లికేషన్స్‌లో సగం ప్రచురణలు మాత్రమే సరిహద్దు ఎంపికను సమర్థించాయి మరియు తరచుగా ఈ సమర్థనలు అస్పష్టంగా ఉంటాయి లేదా వివరంగా ఉండవు.

ఏదైనా సందర్భంలో, ఈ విధానం ఆసక్తికరంగా అనిపిస్తుంది ఎందుకంటే ... అవసరమైన నమూనా పరిమాణాన్ని తగ్గించడం ద్వారా, ఇది పరీక్ష వేగాన్ని పెంచుతుంది మరియు అందువలన, నిర్ణయం తీసుకునే వేగాన్ని పెంచుతుంది. - డారియా ముఖినా, Skyeng మొబైల్ అప్లికేషన్ కోసం ఉత్పత్తి విశ్లేషకుడు.

స్టిచ్ ఫిక్స్ బృందం విభిన్న విషయాలను పరీక్షించడానికి ఇష్టపడుతుంది. మొత్తం సాంకేతిక సంఘం సూత్రప్రాయంగా పరీక్షలను అమలు చేయడానికి ఇష్టపడుతుంది. సైట్ యొక్క ఏ వెర్షన్ ఎక్కువ మంది వినియోగదారులను ఆకర్షిస్తుంది - A లేదా B? సిఫార్సు మోడల్ యొక్క వెర్షన్ A సంస్కరణ B కంటే ఎక్కువ డబ్బు సంపాదించగలదా? పరికల్పనలను పరీక్షించడానికి, మేము దాదాపు ఎల్లప్పుడూ ప్రాథమిక గణాంకాల కోర్సు నుండి సరళమైన విధానాన్ని ఉపయోగిస్తాము:

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

మేము ఈ పదాన్ని చాలా అరుదుగా ఉపయోగిస్తున్నప్పటికీ, ఈ రకమైన పరీక్షను "సుపీరియారిటీ పరికల్పన పరీక్ష" అని పిలుస్తారు. ఈ విధానంతో, రెండు ఎంపికల మధ్య తేడా లేదని మేము అనుకుంటాము. మేము ఈ ఆలోచనకు కట్టుబడి ఉంటాము మరియు డేటా అలా చేయడానికి తగినంతగా బలవంతంగా ఉంటే మాత్రమే దానిని వదిలివేస్తాము-అంటే, ఎంపికలలో ఒకటి (A లేదా B) మరొకదాని కంటే మెరుగైనదని ఇది చూపిస్తుంది.

ఆధిక్యత పరికల్పనను పరీక్షించడం వివిధ సమస్యలకు అనుకూలంగా ఉంటుంది. ఇప్పటికే వాడుకలో ఉన్న వెర్షన్ A కంటే స్పష్టంగా మెరుగ్గా ఉంటేనే మేము సిఫార్సు మోడల్ వెర్షన్ Bని విడుదల చేస్తాము. కానీ కొన్ని సందర్భాల్లో, ఈ విధానం అంత బాగా పని చేయదు. కొన్ని ఉదాహరణలు చూద్దాం.

1) మేము మూడవ పక్ష సేవను ఉపయోగిస్తాము, ఇది నకిలీ బ్యాంకు కార్డులను గుర్తించడంలో సహాయపడుతుంది. మేము చాలా తక్కువ ఖర్చుతో కూడిన మరొక సేవను కనుగొన్నాము. మేము ప్రస్తుతం ఉపయోగిస్తున్న దానితో పాటు చౌకైన సేవ కూడా పనిచేస్తే, మేము దానిని ఎంచుకుంటాము. ఇది మీరు ఉపయోగిస్తున్న సేవ కంటే మెరుగైనదిగా ఉండవలసిన అవసరం లేదు.

2) మేము డేటా మూలాన్ని వదిలివేయాలనుకుంటున్నాము A మరియు దానిని డేటా సోర్స్ Bతో భర్తీ చేయండి. B చాలా చెడ్డ ఫలితాలను ఇస్తే మేము Aని వదిలివేయడాన్ని ఆలస్యం చేయవచ్చు, కానీ Aని ఉపయోగించడం కొనసాగించడం సాధ్యం కాదు.

3) మేము మోడలింగ్ విధానం నుండి మారాలనుకుంటున్నాముA నుండి B యొక్క విధానం మేము B నుండి మెరుగైన ఫలితాలను ఆశించడం వల్ల కాదు, కానీ అది మాకు ఎక్కువ కార్యాచరణ సౌలభ్యాన్ని ఇస్తుంది కాబట్టి. B అధ్వాన్నంగా ఉంటుందని నమ్మడానికి మాకు ఎటువంటి కారణం లేదు, అయితే ఇదే జరిగితే మేము మార్పు చేయము.

4) మేము అనేక గుణాత్మక మార్పులు చేసాము వెబ్‌సైట్ డిజైన్‌లో (వెర్షన్ B) మరియు ఈ వెర్షన్ వెర్షన్ A కంటే మెరుగైనదని నమ్ముతున్నాము. మార్పిడిలో మార్పులను లేదా మేము సాధారణంగా వెబ్‌సైట్‌ను మూల్యాంకనం చేసే కీలక పనితీరు సూచికలను మేము ఆశించము. కానీ కొలవలేని లేదా మా సాంకేతికత కొలవడానికి సరిపోని పారామితులలో ప్రయోజనాలు ఉన్నాయని మేము నమ్ముతున్నాము.

వీటన్నింటిలో, ఆధిక్యత పరిశోధన చాలా సరైన పరిష్కారం కాదు. కానీ అలాంటి పరిస్థితుల్లో చాలా మంది నిపుణులు దీనిని డిఫాల్ట్‌గా ఉపయోగిస్తారు. ప్రభావం యొక్క పరిమాణాన్ని సరిగ్గా నిర్ణయించడానికి మేము ప్రయోగాన్ని జాగ్రత్తగా నిర్వహిస్తాము. A మరియు B సంస్కరణలు చాలా సారూప్య మార్గాల్లో పనిచేస్తాయనేది నిజమైతే, మేము శూన్య పరికల్పనను తిరస్కరించడంలో విఫలమయ్యే అవకాశం ఉంది. A మరియు B ప్రాథమికంగా ఒకేలా పనిచేస్తాయని మేము నిర్ధారించాలా? లేదు! శూన్య పరికల్పనను తిరస్కరించడంలో వైఫల్యం మరియు శూన్య పరికల్పన యొక్క అంగీకారం ఒకే విషయం కాదు.

టైప్ II లోపం (తిరస్కరించడంలో విఫలమయ్యే సంభావ్యత) కంటే టైప్ I లోపం (శూన్య పరికల్పనను తిరస్కరించడంలో విఫలమయ్యే సంభావ్యత, తరచుగా ఆల్ఫా అని పిలువబడే సంభావ్యత) కోసం నమూనా పరిమాణ గణనలు (వాస్తవానికి, మీరు చేసినవి) కఠినమైన హద్దులతో చేయబడతాయి. శూన్య పరికల్పన, శూన్య పరికల్పన తప్పు అని షరతు ఇవ్వబడింది, దీనిని తరచుగా బీటా అంటారు). ఆల్ఫా యొక్క సాధారణ విలువ 0,05, అయితే బీటా యొక్క సాధారణ విలువ 0,20, ఇది గణాంక శక్తి 0,80కి అనుగుణంగా ఉంటుంది. దీనర్థం, మన శక్తి గణనలలో మేము పేర్కొన్న పరిమాణం యొక్క నిజమైన ప్రభావాన్ని మనం కోల్పోయే అవకాశం 20% ఉంది మరియు ఇది సమాచారంలో చాలా తీవ్రమైన గ్యాప్. ఉదాహరణగా, కింది పరికల్పనలను పరిశీలిద్దాం:

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

H0: నా బ్యాక్‌ప్యాక్ నా గదిలో లేదు (3)
H1: నా బ్యాక్‌ప్యాక్ నా గదిలో ఉంది (4)

నేను నా గదిని శోధించి, నా బ్యాక్‌ప్యాక్ కనుగొనబడితే, గొప్పది, నేను శూన్య పరికల్పనను తిరస్కరించగలను. కానీ నేను గది చుట్టూ వెతికినా నా బ్యాక్‌ప్యాక్ (మూర్తి 1) కనిపించకపోతే, నేను ఏ తీర్మానం చేయాలి? అది అక్కడ లేదని నేను ఖచ్చితంగా అనుకుంటున్నానా? నేను తగినంత కఠినంగా కనిపించానా? నేను 80% గదిని మాత్రమే శోధిస్తే? వీపున తగిలించుకొనే సామాను సంచి ఖచ్చితంగా గదిలో లేదని నిర్ధారించడం అనేది ఒక దృఢమైన నిర్ణయం. మేము "శూన్య పరికల్పనను అంగీకరించలేము" అని ఆశ్చర్యపోనవసరం లేదు.
నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?
మేము శోధించిన ప్రాంతం
మేము బ్యాక్‌ప్యాక్‌ని కనుగొనలేదు - మేము శూన్య పరికల్పనను అంగీకరించాలా?

మూర్తి 1: గదిలో 80% శోధించడం అంటే దాదాపు 80% శక్తితో వెతకడం లాంటిదే. 80% గదిని వెతికినా మీకు బ్యాక్‌ప్యాక్ కనిపించకపోతే, అది అక్కడ లేదని మీరు నిర్ధారించగలరా?

కాబట్టి ఈ పరిస్థితిలో డేటా సైంటిస్ట్ ఏమి చేయాలి? మీరు అధ్యయనం యొక్క శక్తిని బాగా పెంచుకోవచ్చు, కానీ అప్పుడు మీకు చాలా పెద్ద నమూనా పరిమాణం అవసరం మరియు ఫలితం ఇప్పటికీ సంతృప్తికరంగా ఉండదు.

అదృష్టవశాత్తూ, క్లినికల్ రీసెర్చ్ ప్రపంచంలో ఇటువంటి సమస్యలు చాలాకాలంగా అధ్యయనం చేయబడ్డాయి. ఔషధం A కంటే ఔషధం B చౌకైనది; డ్రగ్ A కంటే డ్రగ్ B తక్కువ దుష్ప్రభావాలకు కారణమవుతుందని భావిస్తున్నారు; B మందు రవాణా చేయడం సులభం ఎందుకంటే దానిని శీతలీకరించాల్సిన అవసరం లేదు, కానీ ఔషధం A చేస్తుంది. నాన్ ఇన్ఫీరియారిటీ యొక్క పరికల్పనను పరీక్షిద్దాం. ఇది సంస్కరణ A వలె సంస్కరణ B కూడా మంచిదని చూపుతుంది—కనీసం ముందుగా నిర్వచించబడిన నాన్‌ఇన్‌ఫిరియారిటీ మార్జిన్‌లో, Δ. మేము ఈ పరిమితిని ఎలా సెట్ చేయాలనే దాని గురించి కొంచెం తర్వాత మాట్లాడుతాము. కానీ ప్రస్తుతానికి ఇది ఆచరణాత్మకంగా అర్ధవంతమైన అతి చిన్న వ్యత్యాసం అని అనుకుందాం (క్లినికల్ ట్రయల్స్ సందర్భంలో, దీనిని సాధారణంగా క్లినికల్ ప్రాముఖ్యత అంటారు).

నాన్-ఇన్‌ఫీరియారిటీ పరికల్పనలు ప్రతిదానిని తలకిందులు చేస్తాయి:

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

ఇప్పుడు, ఎటువంటి తేడా లేదని భావించే బదులు, వెర్షన్ A కంటే వెర్షన్ B అధ్వాన్నంగా ఉందని మేము అనుకుంటాము మరియు ఇది అలా కాదని మేము ప్రదర్శించే వరకు మేము ఈ ఊహకు కట్టుబడి ఉంటాము. ఏకపక్ష పరికల్పన పరీక్షను ఉపయోగించడం సమంజసమైన క్షణం ఇదే! ఆచరణలో, ఇది విశ్వాస విరామాన్ని నిర్మించడం ద్వారా మరియు విరామం నిజానికి Δ కంటే ఎక్కువగా ఉందో లేదో నిర్ణయించడం ద్వారా చేయవచ్చు (మూర్తి 2).
నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

Δ ఎంచుకోండి

సరైన Δ ను ఎలా ఎంచుకోవాలి? Δ ఎంపిక ప్రక్రియలో గణాంక సమర్థన మరియు వాస్తవిక మూల్యాంకనం ఉంటాయి. క్లినికల్ రీసెర్చ్ ప్రపంచంలో, డెల్టా అతిచిన్న వైద్యపరంగా ముఖ్యమైన వ్యత్యాసాన్ని సూచించాలని నిర్దేశించే రెగ్యులేటరీ మార్గదర్శకాలు ఉన్నాయి-ఇది ఆచరణలో తేడాను కలిగిస్తుంది. మిమ్మల్ని మీరు పరీక్షించుకోవడానికి యూరోపియన్ మార్గదర్శకాల నుండి ఒక కోట్ ఇక్కడ ఉంది: “వ్యత్యాసాన్ని సరిగ్గా ఎంచుకున్నట్లయితే, పూర్తిగా –∆ మరియు 0... మధ్య ఉండే విశ్వాస విరామం నాన్-ఫీరియారిటీని ప్రదర్శించడానికి ఇప్పటికీ సరిపోతుంది. ఈ ఫలితం ఆమోదయోగ్యం కానట్లయితే, ∆ సముచితంగా ఎంపిక చేయబడలేదని అర్థం.

నిజమైన నియంత్రణ (ప్లేసిబో/చికిత్స లేదు)కి సంబంధించి డెల్టా ఖచ్చితంగా వెర్షన్ A యొక్క ప్రభావ పరిమాణాన్ని మించకూడదు, ఎందుకంటే ఇది వెర్షన్ B నిజమైన నియంత్రణ కంటే అధ్వాన్నంగా ఉందని చెప్పడానికి దారి తీస్తుంది, అదే సమయంలో “నాన్-ఫీరియారిటీని ప్రదర్శిస్తుంది. ." సంస్కరణ Aని ప్రవేశపెట్టినప్పుడు, అది వెర్షన్ 0 ద్వారా భర్తీ చేయబడిందని లేదా ఆ లక్షణం ఉనికిలో లేదని అనుకుందాం (మూర్తి 3 చూడండి).

ఆధిక్యత పరికల్పనను పరీక్షించే ఫలితాల ఆధారంగా, ప్రభావం పరిమాణం E వెల్లడి చేయబడింది (అనగా, బహుశా μ^A−μ^0=E). ఇప్పుడు A అనేది మా కొత్త ప్రమాణం, మరియు B అనేది A వలె మంచిదని నిర్ధారించుకోవాలనుకుంటున్నాము. μB−μA≤−Δ (శూన్య పరికల్పన) వ్రాయడానికి మరొక మార్గం μB≤μA−Δ. మేము డూ E కి సమానం లేదా ఎక్కువ అని ఊహిస్తే, μB ≤ μA−E ≤ ప్లేసిబో. μB కోసం మా అంచనా పూర్తిగా μA−Eని మించిపోయిందని ఇప్పుడు మనం చూస్తాము, ఇది శూన్య పరికల్పనను పూర్తిగా తిరస్కరిస్తుంది మరియు B A వలె మంచిదని నిర్ధారించడానికి అనుమతిస్తుంది, అయితే అదే సమయంలో μB ≤ μ ప్లేసిబో కావచ్చు, ఇది కాదు కేసు. మనకు ఏమి కావాలి. (మూర్తి 3).

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?
మూర్తి 3. నాన్‌ఇన్‌ఫిరియారిటీ మార్జిన్‌ని ఎంచుకోవడం వల్ల కలిగే నష్టాల ప్రదర్శన. కటాఫ్ చాలా ఎక్కువగా ఉంటే, B అనేది A కంటే తక్కువ కాదు, కానీ అదే సమయంలో ప్లేసిబో నుండి వేరు చేయలేనిది అని నిర్ధారించవచ్చు. మేము ప్లేసిబో (A) కంటే స్పష్టంగా మరింత ప్రభావవంతమైన ఔషధాన్ని ప్లేసిబో వలె ప్రభావవంతమైన ఔషధానికి మార్పిడి చేయము.

α యొక్క ఎంపిక

αని ఎంచుకోవడానికి వెళ్దాం. మీరు ప్రామాణిక విలువ α = 0,05ని ఉపయోగించవచ్చు, కానీ ఇది పూర్తిగా న్యాయమైనది కాదు. ఉదాహరణకు, మీరు ఆన్‌లైన్‌లో ఏదైనా కొనుగోలు చేసినప్పుడు మరియు ఒకేసారి అనేక డిస్కౌంట్ కోడ్‌లను ఉపయోగించినప్పుడు, వాటిని కలపకూడదు - డెవలపర్ పొరపాటు చేసారు మరియు మీరు దాని నుండి తప్పించుకున్నారు. నియమాల ప్రకారం, α యొక్క విలువ ఆధిక్యత పరికల్పనను పరీక్షించేటప్పుడు ఉపయోగించే α యొక్క సగం విలువకు సమానంగా ఉండాలి, అంటే 0,05 / 2 = 0,025.

నమూనా పరిమాణం

నమూనా పరిమాణాన్ని ఎలా అంచనా వేయాలి? A మరియు B మధ్య నిజమైన సగటు వ్యత్యాసం 0 అని మీరు విశ్వసిస్తే, మీరు ఉపయోగించిన ప్రభావ పరిమాణాన్ని నాన్‌ఇన్‌ఫీరియారిటీ మార్జిన్‌తో భర్తీ చేయడం మినహా, ఆధిక్యత పరికల్పనను పరీక్షించేటప్పుడు నమూనా పరిమాణం గణన సమానంగా ఉంటుంది. నాన్-ఇన్‌ఫీరియర్ ఎఫిషియెన్సీ = 1/2αఆధిక్యత (α నాన్-ఇన్‌ఫీరియారిటీ=1/2αఆధిక్యత). ఎంపిక A కంటే B ఎంపిక కొంచెం అధ్వాన్నంగా ఉండవచ్చని మీరు విశ్వసించడానికి కారణం ఉంటే, కానీ మీరు Δ కంటే అధ్వాన్నంగా ఉందని నిరూపించాలనుకుంటే, మీరు అదృష్టవంతులు! ఇది వాస్తవానికి మీ నమూనా పరిమాణాన్ని తగ్గిస్తుంది, ఎందుకంటే మీరు వాస్తవానికి సమానంగా కాకుండా కొంచెం అధ్వాన్నంగా ఉందని భావిస్తే, A కంటే B అధ్వాన్నంగా ఉందని నిరూపించడం సులభం.

పరిష్కారంతో ఉదాహరణ

మీరు 0,1-పాయింట్ కస్టమర్ సంతృప్తి స్కేల్‌లో వెర్షన్ A కంటే 5 పాయింట్ కంటే అధ్వాన్నంగా ఉంటే, మీరు వెర్షన్ Bకి అప్‌గ్రేడ్ చేయాలనుకుంటున్నారని అనుకుందాం... ఈ సమస్యను అధిష్టానం పరికల్పనను ఉపయోగించి పరిశీలిద్దాం.

ఆధిక్యత పరికల్పనను పరీక్షించడానికి, మేము ఈ క్రింది విధంగా నమూనా పరిమాణాన్ని గణిస్తాము:

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

అంటే, మీరు మీ సమూహంలో 2103 పరిశీలనలను కలిగి ఉన్నట్లయితే, మీరు 90 లేదా అంతకంటే ఎక్కువ ప్రభావం పరిమాణాన్ని కనుగొంటారని మీరు 0,10% నమ్మకంగా ఉండవచ్చు. కానీ మీ కోసం 0,10 చాలా ఎక్కువగా ఉంటే, దాని కోసం ఆధిక్యత పరికల్పనను పరీక్షించడం విలువైనది కాదు. సురక్షితంగా ఉండటానికి, మీరు 0,05 వంటి చిన్న ప్రభావ పరిమాణం కోసం అధ్యయనాన్ని అమలు చేయాలని నిర్ణయించుకోవచ్చు. ఈ సందర్భంలో, మీకు 8407 పరిశీలనలు అవసరం, అంటే, నమూనా దాదాపు 4 రెట్లు పెరుగుతుంది. అయితే మనం మన అసలు నమూనా పరిమాణానికి అతుక్కుపోయి, పవర్‌ను 0,99కి పెంచినట్లయితే, సానుకూల ఫలితం వస్తే మనం సురక్షితంగా ఉంటాము? ఈ సందర్భంలో, ఒక సమూహం కోసం n 3676 అవుతుంది, ఇది ఇప్పటికే మెరుగ్గా ఉంది, కానీ నమూనా పరిమాణాన్ని 50% కంటే ఎక్కువ పెంచుతుంది. మరియు ఫలితంగా, మేము ఇప్పటికీ శూన్య పరికల్పనను తిరస్కరించలేము మరియు మా ప్రశ్నకు మేము సమాధానం పొందలేము.

బదులుగా మేము నాన్‌ఇన్‌ఫిరియారిటీ పరికల్పనను పరీక్షిస్తే?

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

హారం మినహా నమూనా పరిమాణం అదే సూత్రాన్ని ఉపయోగించి లెక్కించబడుతుంది.
ఆధిక్యత పరికల్పనను పరీక్షించడానికి ఉపయోగించే ఫార్ములా నుండి తేడాలు క్రింది విధంగా ఉన్నాయి:

— Z1−α/2 స్థానంలో Z1−α ఉంటుంది, కానీ మీరు నిబంధనల ప్రకారం ప్రతిదీ చేస్తే, మీరు α = 0,05ని α = 0,025తో భర్తీ చేస్తారు, అంటే అదే సంఖ్య (1,96)

— (μB−μA) హారంలో కనిపిస్తుంది

— θ (ప్రభావ పరిమాణం) Δ ద్వారా భర్తీ చేయబడింది (నాన్-ఇన్‌ఫీరియారిటీ మార్జిన్)

మేము µB = µA అని ఊహిస్తే, అప్పుడు (µB - µA) = 0 మరియు నాన్‌ఇన్‌ఫీరియారిటీ మార్జిన్‌కి నమూనా పరిమాణం గణన అనేది మనం 0,1 ప్రభావ పరిమాణానికి ఆధిక్యతను లెక్కించినట్లయితే మనకు ఖచ్చితంగా లభిస్తుంది, చాలా బాగుంది! మేము వేర్వేరు పరికల్పనలతో మరియు తీర్మానాలకు భిన్నమైన విధానంతో ఒకే పరిమాణంలో అధ్యయనం చేయవచ్చు మరియు మేము నిజంగా సమాధానం చెప్పాలనుకుంటున్న ప్రశ్నకు సమాధానాన్ని పొందుతాము.

ఇప్పుడు మనం నిజానికి µB = µA మరియు అని భావించడం లేదని అనుకుందాం
µB కొంచెం అధ్వాన్నంగా ఉందని మేము భావిస్తున్నాము, బహుశా 0,01 యూనిట్లు. ఇది మా హారంను పెంచుతుంది, ఒక్కో సమూహానికి నమూనా పరిమాణాన్ని 1737కి తగ్గిస్తుంది.

వెర్షన్ B నిజానికి వెర్షన్ A కంటే మెరుగ్గా ఉంటే ఏమి జరుగుతుంది? మేము Δ కంటే A కంటే అధ్వాన్నంగా ఉందనే శూన్య పరికల్పనను మేము తిరస్కరించాము మరియు B, అధ్వాన్నంగా ఉంటే, Δ ద్వారా A కంటే అధ్వాన్నంగా ఉండదు మరియు మెరుగ్గా ఉండవచ్చు అనే ప్రత్యామ్నాయ పరికల్పనను అంగీకరిస్తాము. ఈ ముగింపును క్రాస్-ఫంక్షనల్ ప్రెజెంటేషన్‌లో ఉంచడానికి ప్రయత్నించండి మరియు ఏమి జరుగుతుందో చూడండి (తీవ్రంగా, దీన్ని ప్రయత్నించండి). ముందుకు చూసే పరిస్థితిలో, ఎవరూ "Δ కంటే అధ్వాన్నంగా మరియు ఉత్తమంగా" స్థిరపడాలని కోరుకోరు.

ఈ సందర్భంలో, మేము ఒక అధ్యయనాన్ని నిర్వహించగలము, దీనిని చాలా క్లుప్తంగా "ఆప్షన్లలో ఒకటి మరొకదాని కంటే ఉన్నతమైనది లేదా తక్కువ అని పరికల్పనను పరీక్షించడం" అని పిలుస్తారు. ఇది రెండు సెట్ల పరికల్పనలను ఉపయోగిస్తుంది:

మొదటి సెట్ (నాన్-ఇన్‌ఫీరియారిటీ పరికల్పనను పరీక్షించినట్లే):

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

రెండవ సెట్ (ఆధిక్యత పరికల్పనను పరీక్షించేటప్పుడు అదే):

నాన్‌ఇన్‌ఫీరియారిటీ పరికల్పనను మనం ఎప్పుడు పరీక్షించాలి?

మొదటిది తిరస్కరించబడినప్పుడు మాత్రమే మేము రెండవ పరికల్పనను పరీక్షిస్తాము. సీక్వెన్షియల్‌గా పరీక్షిస్తున్నప్పుడు, మేము మొత్తం టైప్ I ఎర్రర్ రేట్ (α)ని నిర్వహిస్తాము. ఆచరణలో, మొత్తం విరామం -Δ కంటే ఎక్కువగా ఉందో లేదో తెలుసుకోవడానికి సాధనాలు మరియు పరీక్షల మధ్య వ్యత్యాసం కోసం 95% విశ్వాస విరామాన్ని సృష్టించడం ద్వారా దీనిని సాధించవచ్చు. విరామం -Δ మించకపోతే, మేము శూన్య విలువను తిరస్కరించలేము మరియు ఆపలేము. మొత్తం విరామం నిజానికి −Δ కంటే పెద్దదైతే, మేము కొనసాగిస్తాము మరియు విరామంలో 0 ఉందో లేదో చూస్తాము.

మేము చర్చించని మరొక రకమైన పరిశోధన ఉంది - సమానత్వ అధ్యయనాలు.

ఈ రకమైన అధ్యయనాలు నాన్‌ఇన్‌ఫీరియారిటీ స్టడీస్‌తో భర్తీ చేయబడతాయి మరియు దీనికి విరుద్ధంగా ఉంటాయి, కానీ వాస్తవానికి వాటికి ముఖ్యమైన తేడా ఉంది. నాన్‌ఇన్‌ఫిరియారిటీ ట్రయల్ అనేది ఆప్షన్ B కనీసం A వలె మంచిదని చూపడం లక్ష్యంగా పెట్టుకుంది. సమానత్వ ట్రయల్ ఎంపిక B కనీసం A వలె మంచిదని చూపిస్తుంది. ఎంపిక A B వలె మంచిది, ఇది చాలా కష్టం. ముఖ్యంగా, మేము సాధనాల్లోని వ్యత్యాసానికి సంబంధించిన పూర్తి విశ్వాస విరామం −Δ మరియు Δ మధ్య ఉందో లేదో తెలుసుకోవడానికి ప్రయత్నిస్తున్నాము. ఇటువంటి అధ్యయనాలకు పెద్ద నమూనా పరిమాణం అవసరం మరియు తక్కువ తరచుగా నిర్వహించబడుతుంది. కాబట్టి మీరు తదుపరిసారి కొత్త వెర్షన్ అధ్వాన్నంగా లేదని నిర్ధారించుకోవడం మీ ప్రధాన లక్ష్యం అయిన అధ్యయనాన్ని నిర్వహించినప్పుడు, "శూన్య పరికల్పనను తిరస్కరించడంలో వైఫల్యం" కోసం స్థిరపడకండి. మీరు నిజంగా ముఖ్యమైన పరికల్పనను పరీక్షించాలనుకుంటే, విభిన్న ఎంపికలను పరిగణించండి.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి