Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Ang katuyoan sa artikulo mao ang paghatag suporta sa nagsugod nga mga siyentipiko sa datos. SA miaging artikulo Among gilatid ang tulo ka paagi sa pagsulbad sa usa ka linear regression equation: analytical solution, gradient descent, stochastic gradient descent. Dayon alang sa analitikal nga solusyon atong gigamit ang pormula Gidala namo ang linear regression equation ngadto sa matrix form. Niini nga artikulo, ingon sa gisugyot sa titulo, atong hatagan og katarungan ang paggamit niini nga pormula o, sa laing pagkasulti, kita mismo ang magkuha niini.

Ngano nga makatarunganon ang paghatag ug dugang nga pagtagad sa pormula Gidala namo ang linear regression equation ngadto sa matrix form?

Kini mao ang uban sa matrix equation nga sa kadaghanan sa mga kaso ang usa magsugod sa pagsinati sa linear regression. Sa parehas nga oras, ang mga detalyado nga kalkulasyon kung giunsa nakuha ang pormula talagsa ra.

Pananglitan, sa mga kurso sa pagkat-on sa makina gikan sa Yandex, kung ang mga estudyante gipaila sa regularisasyon, gitanyag sila nga mogamit mga function gikan sa librarya. sklearn, samtang wala'y usa ka pulong ang gihisgutan mahitungod sa representasyon sa matrix sa algorithm. Niining higayona nga ang pipila nga mga tigpaminaw mahimong gusto nga masabtan kini nga isyu sa mas detalyado - pagsulat sa code nga wala gigamit ang andam nga mga gimbuhaton. Ug aron mahimo kini, kinahanglan nimo una nga ipakita ang equation sa usa ka regularizer sa porma sa matrix. Kini nga artikulo magtugot niadtong gusto nga mabatid ang maong mga kahanas. Magsugod na ta.

Inisyal nga mga kondisyon

Target nga mga indikasyon

Kita adunay usa ka lain-laing mga target values. Pananglitan, ang target nga timailhan mahimong ang presyo sa bisan unsang asset: lana, bulawan, trigo, dolyar, ug uban pa. Sa parehas nga oras, pinaagi sa daghang mga kantidad sa target nga timailhan gipasabut namon ang gidaghanon sa mga obserbasyon. Ang ingon nga mga obserbasyon mahimo’g, pananglitan, ang binulan nga presyo sa lana alang sa tuig, sa ato pa, kita adunay 12 nga target nga kantidad. Atong sugdan ang pagpaila sa notasyon. Atong itudlo ang matag bili sa target indicator nga Gidala namo ang linear regression equation ngadto sa matrix form. Sa kinatibuk-an naa mi Gidala namo ang linear regression equation ngadto sa matrix form obserbasyon, nga nagpasabot nga mahimo natong irepresentar ang atong mga obserbasyon isip Gidala namo ang linear regression equation ngadto sa matrix form.

Mga regressor

Atong hunahunaon nga adunay mga hinungdan nga sa usa ka sukod nagpatin-aw sa mga kantidad sa target nga timailhan. Pananglitan, ang dolyar / ruble nga exchange rate kusog nga naimpluwensyahan sa presyo sa lana, ang Federal Reserve rate, ug uban pa. Ang ingon nga mga hinungdan gitawag nga mga regressor. Sa parehas nga oras, ang matag target nga kantidad sa indikasyon kinahanglan nga katumbas sa usa ka kantidad sa regressor, nga mao, kung kami adunay 12 nga target nga mga indikasyon alang sa matag bulan sa 2018, nan kinahanglan usab kami adunay 12 nga mga kantidad sa regressor alang sa parehas nga panahon. Atong itudlo ang mga mithi sa matag regressor pinaagi sa Gidala namo ang linear regression equation ngadto sa matrix form. Pasagdi sa among kaso ana Gidala namo ang linear regression equation ngadto sa matrix form mga regressor (ie. Gidala namo ang linear regression equation ngadto sa matrix form mga hinungdan nga nag-impluwensya sa mga kantidad sa target indicator). Kini nagpasabot nga ang atong mga regressor mahimong ipresentar sama sa mosunod: alang sa 1st regressor (pananglitan, ang presyo sa lana): Gidala namo ang linear regression equation ngadto sa matrix form, alang sa 2nd regressor (pananglitan, ang Fed rate): Gidala namo ang linear regression equation ngadto sa matrix form, Alang sa "Gidala namo ang linear regression equation ngadto sa matrix form-th" regressor: Gidala namo ang linear regression equation ngadto sa matrix form

Pagsalig sa target nga mga indikasyon sa mga regressor

Atong hunahunaon nga ang pagsalig sa target indicator Gidala namo ang linear regression equation ngadto sa matrix form gikan sa mga regressor"Gidala namo ang linear regression equation ngadto sa matrix formth" obserbasyon mahimong ipahayag pinaagi sa usa ka linear regression equation sa porma:

Gidala namo ang linear regression equation ngadto sa matrix form

diin Gidala namo ang linear regression equation ngadto sa matrix form - "Gidala namo ang linear regression equation ngadto sa matrix form-th" regressor nga bili gikan sa 1 ngadto sa Gidala namo ang linear regression equation ngadto sa matrix form,

Gidala namo ang linear regression equation ngadto sa matrix form - gidaghanon sa mga regressor gikan sa 1 ngadto sa Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form β€” angular coefficients, nga nagrepresentar sa kantidad diin ang kalkulado nga target indicator mausab sa aberids kung ang regressor mausab.

Sa laing pagkasulti, kami para sa tanan (gawas Gidala namo ang linear regression equation ngadto sa matrix form) sa regressor atong matino ang "atong" coefficient Gidala namo ang linear regression equation ngadto sa matrix form, unya i-multiply ang mga coefficient sa mga kantidad sa mga regressors "Gidala namo ang linear regression equation ngadto sa matrix formth" obserbasyon, isip resulta kita makakuha og usa ka piho nga banabana "Gidala namo ang linear regression equation ngadto sa matrix form-th" nga indikasyon sa target.

Busa, kinahanglan natong pilion ang maong mga coefficient Gidala namo ang linear regression equation ngadto sa matrix form, diin ang mga kantidad sa among gibanabana nga function Gidala namo ang linear regression equation ngadto sa matrix form mahimutang nga duol kutob sa mahimo sa target indicator values.

Pagtimbang-timbang sa kalidad sa gibanabana nga function

Atong mahibal-an ang kalidad nga pagtasa sa gibanabana nga function gamit ang labing gamay nga pamaagi sa mga kwadro. Ang function sa pagtasa sa kalidad niini nga kaso magkuha sa mosunod nga porma:

Gidala namo ang linear regression equation ngadto sa matrix form

Kinahanglan namon nga pilion ang ingon nga mga kantidad sa mga coefficient nga $w$ kung diin ang kantidad Gidala namo ang linear regression equation ngadto sa matrix form mahimong pinakagamay.

Pag-convert sa equation ngadto sa matrix nga porma

Representasyon sa vector

Sa pagsugod, aron mas sayon ​​​​ang imong kinabuhi, kinahanglan nimong hatagan ug pagtagad ang linear regression equation ug matikdi nga ang unang coefficient Gidala namo ang linear regression equation ngadto sa matrix form dili gipadaghan sa bisan unsang regressor. Sa samang higayon, kung atong i-convert ang data ngadto sa matrix form, ang nahisgutan sa ibabaw nga sirkumstansya seryosong makapakomplikado sa mga kalkulasyon. Niining bahina, gisugyot nga ipaila ang laing regressor alang sa unang coefficient Gidala namo ang linear regression equation ngadto sa matrix form ug iparehas kini sa usa. O hinoon, matag "Gidala namo ang linear regression equation ngadto sa matrix formiparehas ang ika-ka bili niini nga regressor ngadto sa usa - human sa tanan, sa diha nga gipadaghan sa usa, walay bisan unsa nga mausab gikan sa punto sa panglantaw sa resulta sa mga kalkulasyon, apan gikan sa punto sa panglantaw sa mga lagda alang sa produkto sa matrices, ang atong pagsakit. maminusan pag-ayo.

Karon, sa pagkakaron, aron mapasayon ​​ang materyal, atong hunahunaon nga kita adunay usa ra "Gidala namo ang linear regression equation ngadto sa matrix form-th" obserbasyon. Unya, hunahunaa ang mga kantidad sa mga regressor "Gidala namo ang linear regression equation ngadto sa matrix form-th" obserbasyon isip usa ka vector Gidala namo ang linear regression equation ngadto sa matrix form. Vector Gidala namo ang linear regression equation ngadto sa matrix form adunay dimensyon Gidala namo ang linear regression equation ngadto sa matrix form, nga mao Gidala namo ang linear regression equation ngadto sa matrix form mga laray ug 1 kolum:

Gidala namo ang linear regression equation ngadto sa matrix form

Irepresentar nato ang gikinahanglan nga coefficients isip vector Gidala namo ang linear regression equation ngadto sa matrix form, adunay dimensyon Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Linear regression equation para sa "Gidala namo ang linear regression equation ngadto sa matrix form-th" nga obserbasyon magkuha sa porma:

Gidala namo ang linear regression equation ngadto sa matrix form

Ang gimbuhaton alang sa pagsusi sa kalidad sa usa ka linear nga modelo magkuha sa porma:

Gidala namo ang linear regression equation ngadto sa matrix form

Palihug timan-i nga sumala sa mga lagda sa pagpadaghan sa matrix, kinahanglan namon nga ibalhin ang vector Gidala namo ang linear regression equation ngadto sa matrix form.

Representasyon sa matrix

Ingon usa ka sangputanan sa pagpadaghan sa mga vector, makuha namon ang numero: Gidala namo ang linear regression equation ngadto sa matrix form, nga gipaabot. Kini nga numero mao ang gibanabana nga "Gidala namo ang linear regression equation ngadto sa matrix form-th" nga indikasyon sa target. Apan kinahanglan namon ang usa ka gibanabana nga dili lamang usa ka target nga kantidad, apan silang tanan. Aron mahimo kini, atong isulat ang tanan "Gidala namo ang linear regression equation ngadto sa matrix form-th" regressors sa matrix format Gidala namo ang linear regression equation ngadto sa matrix form. Ang resulta nga matrix adunay dimensyon Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Karon ang linear regression equation magkuha sa porma:

Gidala namo ang linear regression equation ngadto sa matrix form

Atong ipunting ang mga kantidad sa target nga mga indikasyon (tanan Gidala namo ang linear regression equation ngadto sa matrix form) matag vector Gidala namo ang linear regression equation ngadto sa matrix form sukod Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Karon mahimo namong isulat ang equation alang sa pagsusi sa kalidad sa usa ka linear nga modelo sa matrix format:

Gidala namo ang linear regression equation ngadto sa matrix form

Sa tinuud, gikan sa kini nga pormula makuha namon ang pormula nga nahibal-an namon Gidala namo ang linear regression equation ngadto sa matrix form

Giunsa kini nahimo? Gibuksan ang mga braket, gihimo ang pagkalainlain, ang mga sangputanan nga mga ekspresyon gibag-o, ug uban pa, ug mao gyud kini ang atong buhaton karon.

Mga pagbag-o sa matrix

Atong ablihan ang mga bracket

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Mag-andam kita og equation para sa differentiation

Aron mahimo kini, maghimo kami pipila ka mga pagbag-o. Sa sunod nga mga kalkulasyon kini mahimong mas sayon ​​alang kanato kon ang vector Gidala namo ang linear regression equation ngadto sa matrix form irepresentar sa sinugdanan sa matag produkto sa equation.

Pagkakabig 1

Gidala namo ang linear regression equation ngadto sa matrix form

Giunsa kini nahitabo? Aron matubag kini nga pangutana, tan-awa lang ang mga gidak-on sa mga matrice nga gipadaghan ug tan-awa nga sa output makakuha kita usa ka numero o kung dili. Gidala namo ang linear regression equation ngadto sa matrix form.

Atong isulat ang mga gidak-on sa matrix nga mga ekspresyon.

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Pagkakabig 2

Gidala namo ang linear regression equation ngadto sa matrix form

Isulat nato kini sa susamang paagi sa pagbag-o 1

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Sa output nakakuha kami usa ka equation nga kinahanglan namon nga magkalainlain:
Gidala namo ang linear regression equation ngadto sa matrix form

Gilain namon ang function sa pagtasa sa kalidad sa modelo

Maglainlain ta bahin sa vector Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Mga pangutana ngano Gidala namo ang linear regression equation ngadto sa matrix form dili kinahanglan, apan atong susihon ang mga operasyon alang sa pagtino sa mga derivatives sa laing duha ka mga ekspresyon sa mas detalyado.

Pagkalainlain 1

Atong palapdan ang pagkalahi: Gidala namo ang linear regression equation ngadto sa matrix form

Aron mahibal-an ang gigikanan sa usa ka matrix o vector, kinahanglan nimo nga tan-awon kung unsa ang naa sa sulod niini. Atong tan-awon:

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form Gidala namo ang linear regression equation ngadto sa matrix form

Atong itudlo ang produkto sa matrices Gidala namo ang linear regression equation ngadto sa matrix form pinaagi sa matrix Gidala namo ang linear regression equation ngadto sa matrix form. Matrix Gidala namo ang linear regression equation ngadto sa matrix form square ug dugang pa, kini simetriko. Kini nga mga kabtangan mahimong mapuslanon kanato sa ulahi, atong hinumdoman sila. Matrix Gidala namo ang linear regression equation ngadto sa matrix form adunay dimensyon Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Karon ang among tahas mao ang husto nga pagpadaghan sa mga vector sa matrix ug dili makuha ang "kaduha duha mao ang lima," busa magkonsentrar kita ug mag-amping pag-ayo.

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Bisan pa, nakab-ot namon ang usa ka makuti nga ekspresyon! Sa tinuud, nakakuha kami usa ka numero - usa ka scalar. Ug karon, sa tinuud, nagpadayon kami sa pagkalainlain. Kinahanglang pangitaon ang derivative sa resulta nga ekspresyon alang sa matag coefficient Gidala namo ang linear regression equation ngadto sa matrix form ug kuhaa ang dimensyon nga vector isip output Gidala namo ang linear regression equation ngadto sa matrix form. Sa kaso lang, akong isulat ang mga pamaagi pinaagi sa aksyon:

1) paglainlain pinaagi sa Gidala namo ang linear regression equation ngadto sa matrix form, atong makuha: Gidala namo ang linear regression equation ngadto sa matrix form

2) paglainlain pinaagi sa Gidala namo ang linear regression equation ngadto sa matrix form, atong makuha: Gidala namo ang linear regression equation ngadto sa matrix form

3) paglainlain pinaagi sa Gidala namo ang linear regression equation ngadto sa matrix form, atong makuha: Gidala namo ang linear regression equation ngadto sa matrix form

Ang output mao ang gisaad nga vector sa gidak-on Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Kung imong tan-awon pag-ayo ang vector, imong mamatikdan nga ang wala ug katugbang nga tuo nga mga elemento sa vector mahimong ma-grupo sa paagi nga, isip resulta, ang usa ka vector mahimong mahimulag gikan sa gipresentar nga vector Gidala namo ang linear regression equation ngadto sa matrix form gidak-on Gidala namo ang linear regression equation ngadto sa matrix form. Pananglitan Gidala namo ang linear regression equation ngadto sa matrix form (wala nga elemento sa ibabaw nga linya sa vector) Gidala namo ang linear regression equation ngadto sa matrix form (ang tuo nga elemento sa ibabaw nga linya sa vector) mahimong irepresentar nga Gidala namo ang linear regression equation ngadto sa matrix formug Gidala namo ang linear regression equation ngadto sa matrix form - ingon Gidala namo ang linear regression equation ngadto sa matrix form ug uban pa. sa matag linya. Grupo ta:

Gidala namo ang linear regression equation ngadto sa matrix form

Atong kuhaon ang vector Gidala namo ang linear regression equation ngadto sa matrix form ug sa output atong makuha:

Gidala namo ang linear regression equation ngadto sa matrix form

Karon, atong tan-awon pag-ayo ang resulta nga matrix. Ang matrix mao ang sum sa duha ka matrices Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Atong hinumdoman nga sa sayo pa atong namatikdan ang usa ka importante nga kabtangan sa matrix Gidala namo ang linear regression equation ngadto sa matrix form - kini simetriko. Base sa niini nga kabtangan, kita masaligon sa pag-ingon nga ang ekspresyon Gidala namo ang linear regression equation ngadto sa matrix form managsama Gidala namo ang linear regression equation ngadto sa matrix form. Kini dali nga mapamatud-an pinaagi sa pagpalapad sa produkto sa matrices nga elemento sa elemento Gidala namo ang linear regression equation ngadto sa matrix form. Dili namo kini buhaton dinhi; kadtong interesado makasusi niini sa ilang kaugalingon.

Balik ta sa atong ekspresyon. Pagkahuman sa among mga pagbag-o, nahimo kini sa paagi nga gusto namon nga makita kini:

Gidala namo ang linear regression equation ngadto sa matrix form

Busa, nahuman na namo ang unang pagkalahi. Mopadayon ta sa ikaduhang ekspresyon.

Pagkalainlain 2

Gidala namo ang linear regression equation ngadto sa matrix form

Atong sundon ang gibunalan nga dalan. Kini mahimong mas mubo kaysa sa nauna, busa ayaw pagpalayo sa screen.

Atong palapdan ang mga vector ug matrix nga elemento sa elemento:

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Atong tangtangon ang duha gikan sa mga kalkulasyon sa makadiyot - dili kini dako nga papel, unya atong ibalik kini sa iyang dapit. Atong padaghanon ang mga vector sa matrix. Una sa tanan, atong padaghanon ang matrix Gidala namo ang linear regression equation ngadto sa matrix form sa vector Gidala namo ang linear regression equation ngadto sa matrix form, wala kami mga pagdili dinhi. Atong makuha ang gidak-on nga vector Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Himoon nato ang mosunod nga aksyon - i-multiply ang vector Gidala namo ang linear regression equation ngadto sa matrix form ngadto sa resulta nga vector. Sa exit ang numero maghulat kanamo:

Gidala namo ang linear regression equation ngadto sa matrix form

Unya ato kining ilahi. Sa output nakakuha kami usa ka vector sa dimensyon Gidala namo ang linear regression equation ngadto sa matrix form:

Gidala namo ang linear regression equation ngadto sa matrix form

Nagpahinumdom kanako sa usa ka butang? Husto kana! Kini ang produkto sa matrix Gidala namo ang linear regression equation ngadto sa matrix form sa vector Gidala namo ang linear regression equation ngadto sa matrix form.

Sa ingon, ang ikaduha nga pagkalainlain malampuson nga nahuman.

Kay sa usa ka konklusyon

Karon nahibal-an na naton kung giunsa ang pagkaparehas Gidala namo ang linear regression equation ngadto sa matrix form.

Sa katapusan, among ihulagway ang usa ka dali nga paagi aron mabag-o ang sukaranan nga mga pormula.

Atong susihon ang kalidad sa modelo sumala sa labing gamay nga pamaagi sa mga kwadro:
Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Atong ilain ang resulta nga ekspresyon:
Gidala namo ang linear regression equation ngadto sa matrix form Gidala namo ang linear regression equation ngadto sa matrix form

Gidala namo ang linear regression equation ngadto sa matrix form

Literatura

Mga tinubdan sa internet:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Mga libro, mga koleksyon sa mga problema:

1) Mga nota sa lecture sa mas taas nga matematika: full course / D.T. Gisulat - 4th ed. – M.: Iris-press, 2006
2) Applied regression analysis / N. Draper, G. Smith - 2nd ed. – M.: Finance and Statistics, 1986 (hubad gikan sa English)
3) Mga problema sa pagsulbad sa matrix equation:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Source: www.habr.com

Idugang sa usa ka comment