Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Artikli eesmärk on pakkuda tuge alustavatele andmeteadlastele. IN Eelmine artikkel Oleme välja toonud kolm võimalust lineaarse regressioonivõrrandi lahendamiseks: analüütiline lahendus, gradiendi laskumine, stohhastiline gradiendi laskumine. Seejärel kasutasime analüütilise lahenduse jaoks valemit Toome lineaarse regressiooni võrrandi maatriksi kujule. Selles artiklis, nagu pealkiri viitab, põhjendame selle valemi kasutamist või teisisõnu tuletame selle ise.

Miks on mõtet valemile ekstra tähelepanu pöörata Toome lineaarse regressiooni võrrandi maatriksi kujule?

Just maatriksvõrrandiga hakatakse enamasti tutvuma lineaarse regressiooniga. Samal ajal on valemi tuletamise üksikasjalikud arvutused haruldased.

Näiteks Yandexi masinõppekursustel pakutakse õpilastele regulaarsusega tutvumisel võimalust kasutada raamatukogu funktsioone. sklearn, samas ei mainita sõnagi algoritmi maatriksesituse kohta. Just sel hetkel võivad mõned kuulajad soovida seda probleemi üksikasjalikumalt mõista - kirjutada koodi ilma valmisfunktsioone kasutamata. Ja selleks tuleb esmalt esitada võrrand koos regulaatoriga maatriksi kujul. See artikkel võimaldab neil, kes soovivad selliseid oskusi omandada. Alustame.

Esialgsed tingimused

Sihtnäitajad

Meil on sihtväärtuste vahemik. Näiteks võib sihtindikaatoriks olla mis tahes vara hind: nafta, kuld, nisu, dollar jne. Samal ajal peame mitme sihtindikaatori väärtuse all silmas vaatluste arvu. Sellised vaatlused võiksid olla näiteks igakuised naftahinnad aasta kohta ehk meil on 12 sihtväärtust. Alustame tähistuse tutvustamist. Tähistame sihtindikaatori iga väärtust kui Toome lineaarse regressiooni võrrandi maatriksi kujule. Kokku on meil Toome lineaarse regressiooni võrrandi maatriksi kujule vaatlused, mis tähendab, et saame oma vaatlusi esitada kui Toome lineaarse regressiooni võrrandi maatriksi kujule.

Regressorid

Eeldame, et on tegureid, mis teatud määral selgitavad sihtindikaatori väärtusi. Näiteks dollari/rubla vahetuskurssi mõjutavad tugevalt nafta hind, Föderaalreservi kurss jne. Selliseid tegureid nimetatakse regressoriteks. Samas peab iga sihtnäitaja väärtus vastama regressori väärtusele, st kui meil on 12. aastal iga kuu kohta 2018 sihtnäitajat, siis sama perioodi kohta peaks meil olema ka 12 regressori väärtust. Tähistame iga regressori väärtused tähega Toome lineaarse regressiooni võrrandi maatriksi kujule. Olgu meie puhul nii Toome lineaarse regressiooni võrrandi maatriksi kujule regressorid (st. Toome lineaarse regressiooni võrrandi maatriksi kujule tegurid, mis mõjutavad sihtindikaatori väärtusi). See tähendab, et meie regressorid saab esitada järgmiselt: 1. regressori jaoks (näiteks nafta hind): Toome lineaarse regressiooni võrrandi maatriksi kujule, 2. regresori jaoks (näiteks Fed-määr): Toome lineaarse regressiooni võrrandi maatriksi kujule, jaoks "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" regressor: Toome lineaarse regressiooni võrrandi maatriksi kujule

Sihtnäitajate sõltuvus regressoritest

Oletame, et sihtnäitaja sõltuvus Toome lineaarse regressiooni võrrandi maatriksi kujule regressoritelt"Toome lineaarse regressiooni võrrandi maatriksi kujuleth" vaatlust saab väljendada järgmisel kujul oleva lineaarse regressioonivõrrandi kaudu:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Kus Toome lineaarse regressiooni võrrandi maatriksi kujule - "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" regressori väärtus vahemikus 1 kuni Toome lineaarse regressiooni võrrandi maatriksi kujule,

Toome lineaarse regressiooni võrrandi maatriksi kujule — regressorite arv 1 kuni Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule — nurkkoefitsiendid, mis näitavad summat, mille võrra arvutatud sihtnäitaja regressori muutumisel keskmiselt muutub.

Teisisõnu, me oleme kõigi jaoks (v.a Toome lineaarse regressiooni võrrandi maatriksi kujule) määrame regressori koefitsiendi “meie”. Toome lineaarse regressiooni võrrandi maatriksi kujule, siis korrutage koefitsiendid regressorite väärtustega "Toome lineaarse regressiooni võrrandi maatriksi kujuleth" vaatlus, mille tulemusena saame teatud ligikaudse"Toome lineaarse regressiooni võrrandi maatriksi kujule-th" sihtnäitaja.

Seetõttu peame valima sellised koefitsiendid Toome lineaarse regressiooni võrrandi maatriksi kujule, mille juures meie ligikaudse funktsiooni väärtused Toome lineaarse regressiooni võrrandi maatriksi kujule asub sihtindikaatori väärtustele võimalikult lähedal.

Lähendamisfunktsiooni kvaliteedi hindamine

Lähendava funktsiooni kvaliteedihinnangu määrame vähimruutude meetodil. Kvaliteedi hindamise funktsioon on sel juhul järgmine:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Peame valima sellised koefitsientide väärtused $w$, mille väärtus on Toome lineaarse regressiooni võrrandi maatriksi kujule saab olema väikseim.

Võrrandi teisendamine maatriksvormiks

Vektori kujutamine

Alustuseks peaksite oma elu lihtsamaks muutmiseks pöörama tähelepanu lineaarse regressiooni võrrandile ja märkama, et esimene koefitsient Toome lineaarse regressiooni võrrandi maatriksi kujule ei korruta ühegi regressoriga. Samal ajal muudab eelnimetatud asjaolu arvutuste tegemisel andmete maatriksvormingusse teisendamisel oluliselt keerulisemaks. Sellega seoses tehakse ettepanek võtta kasutusele teine ​​regressor esimese koefitsiendi jaoks Toome lineaarse regressiooni võrrandi maatriksi kujule ja võrdsusta see ühega. Või õigemini, iga"Toome lineaarse regressiooni võrrandi maatriksi kujulevõrdsusta selle regressori th väärtus ühega - ühega korrutades ei muutu ju arvutuste tulemuse seisukohalt midagi, aga maatriksite korrutise reeglite seisukohalt on meie piin väheneb oluliselt.

Nüüd oletame materjali lihtsustamiseks praegu, et meil on ainult üks "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" tähelepanek. Seejärel kujutage ette regressorite väärtusi "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" vaatlused vektorina Toome lineaarse regressiooni võrrandi maatriksi kujule. Vektor Toome lineaarse regressiooni võrrandi maatriksi kujule omab mõõdet Toome lineaarse regressiooni võrrandi maatriksi kujuleSee tähendab, et Toome lineaarse regressiooni võrrandi maatriksi kujule read ja 1 veerg:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Esitame vajalikud koefitsiendid vektorina Toome lineaarse regressiooni võrrandi maatriksi kujule, millel on mõõde Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Lineaarse regressiooni võrrand jaoks "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" vaatlus toimub järgmisel kujul:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Lineaarse mudeli kvaliteedi hindamise funktsioon on järgmisel kujul:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Pange tähele, et maatriksi korrutamise reeglite kohaselt pidime vektori transponeerima Toome lineaarse regressiooni võrrandi maatriksi kujule.

Maatriksesitus

Vektorite korrutamise tulemusena saame arvu: Toome lineaarse regressiooni võrrandi maatriksi kujule, mida on oodata. See arv on ligikaudne "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" sihtnäitaja. Kuid me ei vaja mitte ainult ühe sihtväärtuse, vaid kõigi nende väärtust. Selleks kirjutame kõik üles "Toome lineaarse regressiooni võrrandi maatriksi kujule-th" regressorid maatriksvormingus Toome lineaarse regressiooni võrrandi maatriksi kujule. Saadud maatriksil on mõõde Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Nüüd on lineaarse regressiooni võrrand järgmine:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Tähistame sihtnäitajate väärtused (kõik Toome lineaarse regressiooni võrrandi maatriksi kujule) vektori kohta Toome lineaarse regressiooni võrrandi maatriksi kujule dimensioon Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Nüüd saame kirjutada võrrandi lineaarse mudeli kvaliteedi hindamiseks maatriksvormingus:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Tegelikult saame sellest valemist edasi meile teadaoleva valemi Toome lineaarse regressiooni võrrandi maatriksi kujule

Kuidas seda tehakse? Sulgud avatakse, diferentseerimine, saadud avaldised teisendatakse jne ning just seda me nüüd teemegi.

Maatriksiteisendused

Avame sulgud

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Valmistame diferentseerimiseks ette võrrandi

Selleks viime läbi mõned muudatused. Järgnevates arvutustes on meile mugavam, kui vektor Toome lineaarse regressiooni võrrandi maatriksi kujule esitatakse võrrandis iga toote alguses.

Teisendus 1

Toome lineaarse regressiooni võrrandi maatriksi kujule

Kuidas see juhtus? Sellele küsimusele vastamiseks vaadake lihtsalt korrutatavate maatriksite suurusi ja vaadake, et väljundis saame arvu või muu Toome lineaarse regressiooni võrrandi maatriksi kujule.

Paneme kirja maatriksavaldiste suurused.

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Teisendus 2

Toome lineaarse regressiooni võrrandi maatriksi kujule

Kirjutame selle sarnaselt teisendusega 1

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Väljundis saame võrrandi, mida peame eristama:
Toome lineaarse regressiooni võrrandi maatriksi kujule

Me eristame mudeli kvaliteedi hindamise funktsiooni

Diferentseerime vektori suhtes Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Küsimused miks Toome lineaarse regressiooni võrrandi maatriksi kujule ei tohiks olla, kuid uurime lähemalt kahes ülejäänud avaldises olevaid tuletiste määramise tehteid.

Eristamine 1

Laiendame diferentseerumist: Toome lineaarse regressiooni võrrandi maatriksi kujule

Maatriksi või vektori tuletise määramiseks peate vaatama, mis nende sees on. Vaatame:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule Toome lineaarse regressiooni võrrandi maatriksi kujule

Tähistame maatriksite korrutist Toome lineaarse regressiooni võrrandi maatriksi kujule maatriksi kaudu Toome lineaarse regressiooni võrrandi maatriksi kujule. Maatriks Toome lineaarse regressiooni võrrandi maatriksi kujule ruudukujuline ja pealegi sümmeetriline. Need omadused on meile hiljem kasulikud, jätame need meelde. Maatriks Toome lineaarse regressiooni võrrandi maatriksi kujule omab mõõdet Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Nüüd on meie ülesandeks vektorid õigesti korrutada maatriksiga ja mitte saada "kaks korda kaks on viis", seega keskendugem ja olgem äärmiselt ettevaatlikud.

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Siiski oleme saavutanud keeruka väljenduse! Tegelikult saime numbri – skalaari. Ja nüüd siirdume edasi eristamise juurde. Iga koefitsiendi jaoks on vaja leida saadud avaldise tuletis Toome lineaarse regressiooni võrrandi maatriksi kujule ja saada väljundiks mõõtmevektor Toome lineaarse regressiooni võrrandi maatriksi kujule. Panen igaks juhuks protseduurid tegevuse kaupa kirja:

1) eristama Toome lineaarse regressiooni võrrandi maatriksi kujule, saame: Toome lineaarse regressiooni võrrandi maatriksi kujule

2) eristama Toome lineaarse regressiooni võrrandi maatriksi kujule, saame: Toome lineaarse regressiooni võrrandi maatriksi kujule

3) eristama Toome lineaarse regressiooni võrrandi maatriksi kujule, saame: Toome lineaarse regressiooni võrrandi maatriksi kujule

Väljund on lubatud suuruse vektor Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Kui vaatate vektorit lähemalt, märkate, et vektori vasakpoolsed ja vastavad parempoolsed elemendid saab rühmitada nii, et selle tulemusena saab vektori esitatud vektorist eraldada Toome lineaarse regressiooni võrrandi maatriksi kujule suurus Toome lineaarse regressiooni võrrandi maatriksi kujule. Näiteks Toome lineaarse regressiooni võrrandi maatriksi kujule (vektori ülemise rea vasak element) Toome lineaarse regressiooni võrrandi maatriksi kujule (vektori ülemise rea parempoolset elementi) saab esitada kui Toome lineaarse regressiooni võrrandi maatriksi kujuleJa Toome lineaarse regressiooni võrrandi maatriksi kujule - nagu Toome lineaarse regressiooni võrrandi maatriksi kujule jne. igal real. Rühmitame:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Võtame vektori välja Toome lineaarse regressiooni võrrandi maatriksi kujule ja väljundis saame:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Vaatame nüüd saadud maatriksit lähemalt. Maatriks on kahe maatriksi summa Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Tuletame meelde, et veidi varem märkisime maatriksi ühte olulist omadust Toome lineaarse regressiooni võrrandi maatriksi kujule - see on sümmeetriline. Selle omaduse põhjal võime kindlalt öelda, et väljend Toome lineaarse regressiooni võrrandi maatriksi kujule võrdub Toome lineaarse regressiooni võrrandi maatriksi kujule. Seda saab hõlpsasti kontrollida, laiendades maatriksite korrutist elemendi kaupa Toome lineaarse regressiooni võrrandi maatriksi kujule. Siin me seda ei tee, huvilised saavad seda ise kontrollida.

Tuleme tagasi oma väljenduse juurde. Pärast meie ümberkujundamisi selgus, nagu me seda näha tahtsime:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Niisiis, oleme lõpetanud esimese eristamise. Liigume edasi teise väljendi juurde.

Eristamine 2

Toome lineaarse regressiooni võrrandi maatriksi kujule

Lähme läbimöödud teed. See on palju lühem kui eelmine, nii et ärge minge ekraanist liiga kaugele.

Laiendame vektoreid ja maatriksi elementide kaupa:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Võtame need kaks korraks arvutustest välja – see ei mängi suurt rolli, siis paneme oma kohale tagasi. Korrutame vektorid maatriksiga. Kõigepealt korrutame maatriksi Toome lineaarse regressiooni võrrandi maatriksi kujule vektorile Toome lineaarse regressiooni võrrandi maatriksi kujule, meil siin piiranguid pole. Saame suurusvektori Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Teeme järgmise toimingu – korrutame vektorit Toome lineaarse regressiooni võrrandi maatriksi kujule saadud vektorile. Väljapääsu juures ootab meid number:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Siis me eristame seda. Väljundis saame dimensioonivektori Toome lineaarse regressiooni võrrandi maatriksi kujule:

Toome lineaarse regressiooni võrrandi maatriksi kujule

Meenutab mulle midagi? See on õige! See on maatriksi korrutis Toome lineaarse regressiooni võrrandi maatriksi kujule vektorile Toome lineaarse regressiooni võrrandi maatriksi kujule.

Seega on teine ​​diferentseerimine edukalt lõpule viidud.

Selle asemel, et järeldus

Nüüd teame, kuidas võrdsus tekkis Toome lineaarse regressiooni võrrandi maatriksi kujule.

Lõpuks kirjeldame kiiret viisi põhivalemite teisendamiseks.

Hindame mudeli kvaliteeti vähimruutude meetodil:
Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Eristagem saadud avaldist:
Toome lineaarse regressiooni võrrandi maatriksi kujule Toome lineaarse regressiooni võrrandi maatriksi kujule

Toome lineaarse regressiooni võrrandi maatriksi kujule

Kirjandus

Interneti-allikad:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Õpikud, ülesannete kogud:

1) Kõrgema matemaatika loengukonspekt: ​​kogu kursus / D.T. Kirjalik – 4. väljaanne. – M.: Iris-press, 2006
2) Rakenduslik regressioonanalüüs / N. Draper, G. Smith – 2. väljaanne. – M.: Rahandus ja statistika, 1986 (tõlge inglise keelest)
3) Ülesanded maatriksvõrrandite lahendamiseks:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Allikas: www.habr.com

Lisa kommentaar