د مقالې هدف د ډیټا ساینس پوهانو پیل کولو لپاره ملاتړ چمتو کول دي. IN
ولې دا معنی لري چې فورمول ته اضافي پاملرنه وکړئ ?
دا د میټریکس مساوات سره دی چې په ډیری مواردو کې یو څوک د خطي ریګریشن سره آشنا کیږي. په ورته وخت کې، د دې فورمول څنګه اخیستل شوي تفصيلي محاسبې نادر دي.
د مثال په توګه، د Yandex څخه د ماشین زده کړې کورسونو کې، کله چې زده کونکي منظم کولو ته معرفي کیږي، دوی ته وړاندیز کیږي چې د کتابتون څخه کار واخلي. sklearn، پداسې حال کې چې د الګوریتم د میټرکس نمایندګۍ په اړه یوه کلمه نه ده ذکر شوې. دا پدې وخت کې دی چې ځینې اوریدونکي ممکن پدې مسله په ډیر تفصیل پوه شي - د چمتو شوي افعالاتو کارولو پرته کوډ ولیکئ. او د دې کولو لپاره، تاسو باید لومړی د میټریکس بڼه کې د منظم کونکي سره مساوات وړاندې کړئ. دا مقاله به هغو کسانو ته اجازه ورکړي چې غواړي دا ډول مهارتونه ولري. راځه چي پیل یی کړو.
لومړني شرایط
د هدف شاخصونه
موږ د هدف ارزښتونو لړۍ لرو. د مثال په توګه، د هدف شاخص کیدای شي د هرې شتمنۍ بیه وي: تیل، سره زر، غنم، ډالر او نور. په ورته وخت کې، د یو شمیر هدف شاخص ارزښتونو له مخې موږ د کتنو شمیر معنی لرو. دا ډول کتنې کیدای شي، د بیلګې په توګه، د کال لپاره د تیلو میاشتني نرخونه، دا دی، موږ به د 12 هدف ارزښتونه ولرو. راځئ چې د یادښت معرفي کول پیل کړو. راځئ چې د هدف شاخص هر ارزښت په توګه په ګوته کړو . په مجموع کې موږ لرو مشاهدات، پدې معنی چې موږ کولی شو خپل مشاهدې په توګه استازیتوب وکړو .
رجعت کوونکي
موږ به فرض کړو چې داسې عوامل شتون لري چې تر یوې اندازې پورې د هدف شاخص ارزښتونه تشریح کوي. د مثال په توګه، د ډالر/روبل د تبادلې نرخ د تیلو قیمت، د فدرالي زیرمو نرخ، او نور په کلکه اغیزه کوي. دا ډول فکتورونه د ریګریس په نوم یادیږي. په ورته وخت کې، د هر هدف شاخص ارزښت باید د ریګریسر ارزښت سره مطابقت ولري، دا دی، که موږ په 12 کې د هرې میاشتې لپاره 2018 هدف شاخصونه ولرو، نو موږ باید د ورته مودې لپاره 12 ریګریسر ارزښتونه هم ولرو. راځئ چې د هر regressor ارزښتونه په ګوته کړو . اجازه راکړئ چې زموږ په قضیه کې وي regressors (i.e. هغه عوامل چې د هدف شاخص ارزښتونه اغیزه کوي). دا پدې مانا ده چې زموږ راجستر کونکي په لاندې ډول وړاندې کیدی شي: د لومړي ریګریسر لپاره (د مثال په توګه د تیلو قیمت): ، د دوهم ریګریسر لپاره (د مثال په توګه د فیډ نرخ): , لپاره "-تجار کونکی:
په راجستر کونکو باندې د هدف شاخصونو انحصار
راځئ چې فرض کړو چې د هدف شاخص انحصار له رجعت کوونکو څخه "th" مشاهده د فورمې د خطي ریګریشن مساواتو له لارې څرګند کیدی شي:
چیرته - "-th" د ریګریسر ارزښت له 1 څخه تر ,
- له 1 څخه د راجستر کونکو شمیر
- زاویه کوفیینټ، کوم چې د هغه مقدار استازیتوب کوي چې د حساب شوي هدف شاخص به په اوسط ډول بدلون ومومي کله چې ریګریسر بدل شي.
په بل عبارت، موږ د هرچا لپاره یو (پرته له دې ) د ریګریسر موږ د "زموږ" ضخامت ټاکو ، بیا د ریګریسرز ارزښتونو سره کوفیفینټ ضرب کړئ "th "څارنه، په پایله کې موږ یو مشخص اټکل ترلاسه کوو"-th" د هدف شاخص.
له همدې امله، موږ اړتیا لرو چې دا ډول کوفیفینس وټاکو ، په کوم کې چې زموږ د نږدې فعالیت ارزښتونه د هدف شاخص ارزښتونو ته د امکان تر حده نږدې موقعیت لري.
د نږدې فعالیت کیفیت ارزونه
موږ به د لږترلږه مربع میتود په کارولو سره د نږدې فعالیت کیفیت ارزونه وټاکو. پدې حالت کې د کیفیت ارزونې فعالیت به لاندې بڼه واخلي:
موږ اړتیا لرو چې د کوفیفینټ داسې ارزښتونه وټاکو $w$ د کوم لپاره چې ارزښت تر ټولو کوچنی به وي.
د معادلې د میټرکس شکل بدلول
د ویکتور استازیتوب
د پیل کولو لپاره، د خپل ژوند د اسانه کولو لپاره، تاسو باید د خطي ریګریشن مساواتو ته پام وکړئ او په پام کې ونیسئ چې لومړی ضمیمه د هیڅ ریګریسر لخوا نه ضرب کیږي. په ورته وخت کې، کله چې موږ ډاټا د میټریکس بڼه ته واړوو، پورته ذکر شوي شرایط به په جدي توګه محاسبه پیچلې کړي. په دې اړه، دا وړاندیز کیږي چې د لومړي کوفینټ لپاره یو بل ریګریسر معرفي کړي او دا یو سره برابر کړئ. یا بلکه، هر "د دې ریګریسر ارزښت له یو سره مساوي کړئ - په هرصورت، کله چې د یو سره ضرب شي، هیڅ شی به د محاسبې د پایلو له نظره بدلون ونلري، مګر د میټریکونو د محصول لپاره د قواعدو له نظره، زموږ عذاب. د پام وړ کم شي.
اوس، د دې شیبې لپاره، د موادو ساده کولو لپاره، راځئ چې فرض کړو چې موږ یوازې یو "-th" مشاهده. بیا، د راجستر کونکو ارزښتونو تصور وکړئ "- د ویکتور په توګه کتنې . ویکتور ابعاد لري دا دی قطارونه او 1 کالم:
راځئ چې د ویکتور په توګه اړین کوفیفینس استازیتوب وکړو ، ابعاد لري :
د خطي انعطاف مساوات "-th" مشاهده به بڼه واخلي:
د خطي ماډل کیفیت ارزولو لپاره فعالیت به دا بڼه واخلي:
مهرباني وکړئ په یاد ولرئ چې د میټریکس ضرب د قواعدو سره سم، موږ د ویکتور لیږد ته اړتیا لرو .
د میټرکس استازیتوب
د ضرب ویکتورونو په پایله کې، موږ نمبر ترلاسه کوو: ، کوم چې تمه کیږي. دا شمیره نږدې ده "-th" د هدف شاخص. مګر موږ نه یوازې د یو هدف ارزښت نږدې نږدې ته اړتیا لرو ، مګر د دوی ټولو. د دې کولو لپاره، راځئ چې هرڅه ولیکئ "-th" regressors په میټرکس بڼه . پایله لرونکی میټرکس ابعاد لري :
اوس د خطي ریګریشن مساوات به دا بڼه واخلي:
راځئ چې د هدف شاخصونو ارزښتونه په ګوته کړو (ټول ) په هر ویکتور کې ابعاد :
اوس موږ کولی شو د میټریکس په شکل کې د خطي ماډل کیفیت ارزولو لپاره معادل ولیکو:
په حقیقت کې، له دې فورمول څخه موږ نور هغه فورمول ترلاسه کوو چې موږ ته پیژندل شوي
دا څنګه شوی دی؟ بریکٹونه پرانستل شوي، توپیر ترسره کیږي، نتیجه شوي څرګندونې بدلیږي، او داسې نور، او دا هغه څه دي چې موږ به یې اوس وکړو.
د میټرکس بدلونونه
راځئ چې بریکٹونه خلاص کړو
راځئ چې د توپیر لپاره مساوات چمتو کړو
د دې کولو لپاره، موږ به ځینې بدلونونه ترسره کړو. په راتلونکو محاسبو کې دا به زموږ لپاره ډیر اسانه وي که ویکتور په مساوات کې د هر محصول په پیل کې به ښودل کیږي.
تبادله ۱
دا څنګه وشول؟ د دې پوښتنې ځواب لپاره، یوازې د میټریکونو اندازه وګورئ چې ضرب کیږي او وګورئ چې په محصول کې موږ یو شمیر ترلاسه کوو یا بل ډول .
راځئ چې د میټریکس څرګندونو اندازې ولیکئ.
تبادله ۱
راځئ چې دا د بدلون 1 په ورته ډول لیکو
په محصول کې موږ یو مساوات ترلاسه کوو چې موږ باید توپیر وکړو:
موږ د ماډل کیفیت ارزونې فعالیت توپیر کوو
راځئ چې د ویکتور په اړه توپیر وکړو :
پوښتنې ولې باید نه وي، مګر موږ به په نورو دوو څرګندونو کې د مشتقاتو د ټاکلو عملیات په ډیر تفصیل سره وڅیړو.
توپیر 1
راځئ چې توپیر ته پراختیا ورکړو:
د دې لپاره چې د میټریکس یا ویکتور مشتق معلوم کړئ ، تاسو اړتیا لرئ وګورئ چې د دوی دننه څه دي. راځئ وګورو:
راځئ چې د میټریک محصول په ګوته کړو د میټرکس له لارې . میټریکس مربع او سربیره پردې، دا همغږي ده. دا ملکیتونه به وروسته زموږ لپاره ګټور وي، راځئ چې دوی په یاد ولرو. میټریکس ابعاد لري :
اوس زموږ دنده دا ده چې ویکتورونه په سمه توګه د میټریکس لخوا ضرب کړو او "دوه ځله دوه پنځه دي" ترلاسه نکړو، نو راځئ چې تمرکز وکړو او ډیر محتاط اوسو.
په هرصورت، موږ یو پیچلي بیان ترلاسه کړ! په حقیقت کې، موږ یو شمیر ترلاسه کړ - یو سکیلر. او اوس، په حقیقت کې، موږ توپیر ته ځو. دا اړینه ده چې د هر ضمیمه لپاره د پایله شوي بیان مشتق ومومئ او د ابعاد ویکتور د محصول په توګه ترلاسه کړئ . یوازې په دې حالت کې، زه به د عمل په واسطه طرزالعملونه ولیکم:
1) توپیر کول ، موږ ترلاسه کوو:
2) توپیر کول ، موږ ترلاسه کوو:
3) توپیر کول ، موږ ترلاسه کوو:
محصول د اندازې ژمنه شوی ویکتور دی :
که تاسو ویکتور ته ډیر نږدې وګورئ، نو تاسو به وګورئ چې د ویکتور کیڼ او اړونده ښي عناصر په داسې ډول ګروپ کیدی شي چې په پایله کې، یو ویکتور د وړاندې شوي ویکتور څخه جلا کیدی شي. کچه . د مثال په توګه (د ویکتور د پورتنۍ کرښې کیڼ عنصر) (د ویکتور د پورتنۍ کرښې ښی عنصر) په توګه ښودل کیدی شي او - لکه etc په هره کرښه کې. راځئ چې ګروپ وکړو:
راځئ چې ویکتور لرې کړو او په محصول کې موږ ترلاسه کوو:
اوس، راځئ چې د نتیجې میټرکس ته نږدې کتنه وکړو. میټریکس د دوه میټریکونو مجموعه ده :
راځئ چې یادونه وکړو چې لږ دمخه موږ د میټریکس یو مهم ملکیت یادونه وکړه - دا همغږي ده. د دې ملکیت پراساس ، موږ کولی شو په ډاډ سره ووایو چې بیان مساوي . دا د عنصر لخوا د میټرکس محصول عنصر پراخولو سره په اسانۍ سره تایید کیدی شي . موږ به دا دلته ونه کړو؛ علاقمندان کولی شي دا پخپله وګوري.
راځئ چې بیرته خپل بیان ته راشو. زموږ د بدلونونو وروسته، دا هغه لاره وګرځیده چې موږ یې غوښتل وګورو:
نو، موږ لومړی توپیر بشپړ کړ. راځئ چې دویم بیان ته لاړ شو.
توپیر 2
راځئ چې د وهلو لاره تعقیب کړو. دا به د تیر په پرتله خورا لنډ وي، نو له سکرین څخه ډیر لرې مه ځئ.
راځئ چې د عنصر په واسطه ویکتورونه او میټریکس عنصر پراخ کړو:
راځئ چې دواړه د یو څه وخت لپاره له محاسبې څخه لرې کړو - دا لوی رول نه لوبوي ، بیا به یې په خپل ځای کې وساتو. راځئ چې ویکتورونه د میټرکس په واسطه ضرب کړو. تر ټولو لومړی، راځئ چې میټرکس ضرب کړو ویکتور ته ، موږ دلته هیڅ محدودیتونه نه لرو. موږ اندازه ویکتور ترلاسه کوو :
راځئ چې لاندې عمل ترسره کړو - ویکتور ضرب کړئ په پایله کې ویکتور ته. د وتلو په وخت کې به هغه شمیره زموږ په تمه وي:
بیا به یې توپیر وکړو. په محصول کې موږ د ابعاد ویکتور ترلاسه کوو :
ماته یو څه را یادوي؟ هغه صحیح ده! دا د میټرکس محصول دی ویکتور ته .
په دې توګه، دوهم توپیر په بریالیتوب سره بشپړ شو.
پر ځای د يو پایلې
اوس موږ پوهیږو چې مساوات څنګه راغلی .
په نهایت کې، موږ به د بنسټیزو فورمولونو د بدلون لپاره چټکه لاره تشریح کړو.
راځئ چې د لږترلږه مربع میتود سره سم د ماډل کیفیت ارزونه وکړو:
راځئ چې پایله لرونکي بیان توپیر وکړو:
ادبیات
د انټرنیټ سرچینې:
1)
2)
3)
4)
درسي کتابونه، د ستونزو ټولګه:
1) د لوړو ریاضیاتو په اړه د لیکچر نوټونه: بشپړ کورس / D.T. لیکل شوی – څلورم ټوک. – م.: ایریس پریس، ۲۰۰۶
2) اپلایډ ریګریشن تحلیل / N. Draper, G. Smith - 2nd Ed. – M.: مالي او احصایې، 1986 (له انګلیسي څخه ژباړه)
3) د میټریکس مساواتو حل کولو ستونزې:
سرچینه: www.habr.com