Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Artikkelin tarkoituksena on tarjota tukea aloitteleville datatieteilijöille. SISÄÄN edellinen artikkeli Olemme hahmotelleet kolme tapaa ratkaista lineaarisen regressioyhtälön: analyyttinen ratkaisu, gradienttilasku, stokastinen gradienttilasku. Sitten analyyttiseen ratkaisuun käytimme kaavaa Tuomme lineaarisen regressioyhtälön matriisimuotoon. Tässä artikkelissa, kuten otsikko ehdottaa, perustelemme tämän kaavan käytön tai toisin sanoen johdamme sen itse.

Miksi on järkevää kiinnittää erityistä huomiota kaavaan Tuomme lineaarisen regressioyhtälön matriisimuotoon?

Matriisiyhtälön avulla useimmissa tapauksissa aletaan tutustua lineaariseen regressioon. Samaan aikaan yksityiskohtaiset laskelmat kaavan johdosta ovat harvinaisia.

Esimerkiksi Yandexin koneoppimiskursseilla, kun opiskelijat tutustuvat regularisointiin, heille tarjotaan kirjaston toimintojen käyttöä. sklearn, kun taas algoritmin matriisiesittelystä ei mainita sanaakaan. Juuri tällä hetkellä jotkut kuuntelijat saattavat haluta ymmärtää tämän ongelman yksityiskohtaisemmin - kirjoittaa koodia käyttämättä valmiita toimintoja. Ja tehdäksesi tämän, sinun on ensin esitettävä yhtälö regularisoijalla matriisimuodossa. Tämä artikkeli antaa niille, jotka haluavat hallita tällaiset taidot. Aloitetaan.

Alkuolosuhteet

Tavoiteindikaattorit

Meillä on joukko tavoitearvoja. Tavoiteindikaattori voi olla esimerkiksi minkä tahansa omaisuuden hinta: öljy, kulta, vehnä, dollari jne. Samaan aikaan useilla tavoiteindikaattoriarvoilla tarkoitamme havaintojen määrää. Tällaisia ​​havaintoja voivat olla esimerkiksi öljyn kuukausihinnat vuodelle, eli meillä on 12 tavoitearvoa. Aloitetaan merkinnän esittely. Merkitään jokainen tavoiteindikaattorin arvo nimellä Tuomme lineaarisen regressioyhtälön matriisimuotoon. Yhteensä meillä on Tuomme lineaarisen regressioyhtälön matriisimuotoon havainnot, mikä tarkoittaa, että voimme esittää havaintojamme Tuomme lineaarisen regressioyhtälön matriisimuotoon.

Regressorit

Oletetaan, että on olemassa tekijöitä, jotka jossain määrin selittävät tavoiteindikaattorin arvot. Esimerkiksi dollarin/ruplan vaihtokurssiin vaikuttavat voimakkaasti öljyn hinta, Federal Reserve -kurssi jne. Tällaisia ​​tekijöitä kutsutaan regressoreiksi. Samanaikaisesti jokaisen tavoiteindikaattorin arvon tulee vastata regressoriarvoa, eli jos meillä on 12 tavoiteindikaattoria jokaiselle kuukaudelle vuonna 2018, niin meillä pitäisi olla myös 12 regressoriarvoa samalle ajanjaksolle. Merkitään jokaisen regressorin arvot Tuomme lineaarisen regressioyhtälön matriisimuotoon. Olkoon meidän tapauksessamme Tuomme lineaarisen regressioyhtälön matriisimuotoon regressorit (esim. Tuomme lineaarisen regressioyhtälön matriisimuotoon tekijät, jotka vaikuttavat tavoiteindikaattorin arvoihin). Tämä tarkoittaa, että regressorimme voidaan esittää seuraavasti: 1. regressorille (esimerkiksi öljyn hinta): Tuomme lineaarisen regressioyhtälön matriisimuotoon, 2. regressorille (esimerkiksi Fed-korko): Tuomme lineaarisen regressioyhtälön matriisimuotoon, varten "Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" regressori: Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tavoiteindikaattoreiden riippuvuus regressoreista

Oletetaan, että tavoiteindikaattorin riippuvuus Tuomme lineaarisen regressioyhtälön matriisimuotoon taantujilta"Tuomme lineaarisen regressioyhtälön matriisimuotoonth" havainto voidaan ilmaista lineaarisen regressioyhtälön muodossa:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Missä Tuomme lineaarisen regressioyhtälön matriisimuotoon - "Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" regressorin arvo välillä 1 - Tuomme lineaarisen regressioyhtälön matriisimuotoon,

Tuomme lineaarisen regressioyhtälön matriisimuotoon — regressorien lukumäärä 1:stä Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon — kulmakertoimet, jotka edustavat määrää, jolla laskettu tavoiteindikaattori muuttuu keskimäärin regressorin muuttuessa.

Toisin sanoen olemme kaikkia varten (paitsi Tuomme lineaarisen regressioyhtälön matriisimuotoon) regressorista määritämme "meidän" kertoimen Tuomme lineaarisen regressioyhtälön matriisimuotoon, kerro sitten kertoimet regressorien arvoilla "Tuomme lineaarisen regressioyhtälön matriisimuotoon"havainto, tuloksena saadaan tietty likiarvo"Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" tavoiteindikaattori.

Siksi meidän on valittava tällaiset kertoimet Tuomme lineaarisen regressioyhtälön matriisimuotoon, jossa approksimoivamme funktiomme arvot Tuomme lineaarisen regressioyhtälön matriisimuotoon sijoitetaan mahdollisimman lähelle tavoiteindikaattorin arvoja.

Approksimointifunktion laadun arviointi

Määritämme approksimoivan funktion laadunarvioinnin pienimmän neliösumman menetelmällä. Laadunarviointitoiminto on tässä tapauksessa seuraava:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Meidän on valittava sellaiset kertoimien $w$ arvot, joille arvo on Tuomme lineaarisen regressioyhtälön matriisimuotoon tulee olemaan pienin.

Yhtälön muuntaminen matriisimuotoon

Vektoriesitys

Aluksi elämäsi helpottamiseksi sinun tulee kiinnittää huomiota lineaariseen regressioyhtälöön ja huomata, että ensimmäinen kerroin Tuomme lineaarisen regressioyhtälön matriisimuotoon ei kerrota millään regressorilla. Samalla kun muunnamme tiedot matriisimuotoon, edellä mainittu seikka vaikeuttaa laskelmia vakavasti. Tässä suhteessa ehdotetaan toisen regressorin käyttöönottoa ensimmäiselle kertoimelle Tuomme lineaarisen regressioyhtälön matriisimuotoon ja rinnastaa se yhteen. Tai pikemminkin jokainen"Tuomme lineaarisen regressioyhtälön matriisimuotoonrinnastaa tämän regressorin arvo yhdeksi - kunhan kerrottuna yhdellä, mikään ei muutu laskelmien tuloksen kannalta, mutta matriisien tulon sääntöjen kannalta meidän kärsimyksemme vähenee merkittävästi.

Oletetaan nyt tällä hetkellä materiaalin yksinkertaistamiseksi, että meillä on vain yksi "Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" havainto. Kuvittele sitten regressoreiden arvot "Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" havainnot vektorina Tuomme lineaarisen regressioyhtälön matriisimuotoon. Vektori Tuomme lineaarisen regressioyhtälön matriisimuotoon on ulottuvuus Tuomme lineaarisen regressioyhtälön matriisimuotoonToisin sanoen, Tuomme lineaarisen regressioyhtälön matriisimuotoon rivit ja 1 sarake:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Esitetään tarvittavat kertoimet vektorina Tuomme lineaarisen regressioyhtälön matriisimuotoon, jolla on mitta Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Lineaarinen regressioyhtälö ""Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" havainto on muotoa:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Lineaarisen mallin laadun arviointifunktio on muotoa:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Huomaa, että matriisin kertolaskusääntöjen mukaisesti meidän piti transponoida vektori Tuomme lineaarisen regressioyhtälön matriisimuotoon.

Matriisiesitys

Vektorien kertomisen tuloksena saamme luvun: Tuomme lineaarisen regressioyhtälön matriisimuotoon, mikä on odotettavissa. Tämä luku on likimääräinen "Tuomme lineaarisen regressioyhtälön matriisimuotoon-th" tavoiteindikaattori. Mutta emme tarvitse likiarvoa vain yhdestä tavoitearvosta, vaan kaikista niistä. Tätä varten kirjoitetaan kaikki ylös "Tuomme lineaarisen regressioyhtälön matriisimuotoon"th" regressorit matriisimuodossa Tuomme lineaarisen regressioyhtälön matriisimuotoon. Tuloksena olevalla matriisilla on ulottuvuus Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Nyt lineaarinen regressioyhtälö saa muodon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Merkitään tavoiteindikaattoreiden arvot (kaikki Tuomme lineaarisen regressioyhtälön matriisimuotoon) vektoria kohti Tuomme lineaarisen regressioyhtälön matriisimuotoon ulottuvuus Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Nyt voimme kirjoittaa yhtälön lineaarisen mallin laadun arvioimiseksi matriisimuodossa:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Itse asiassa tästä kaavasta saamme edelleen meille tunteman kaavan Tuomme lineaarisen regressioyhtälön matriisimuotoon

Miten se on tehty? Sulut avataan, eriyttäminen suoritetaan, tuloksena olevat lausekkeet muunnetaan jne., ja juuri näin teemme nyt.

Matriisimuunnokset

Avataan sulut

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Valmistetaan yhtälö differentiaatiota varten

Tätä varten teemme joitain muutoksia. Myöhemmissä laskelmissa meille on mukavampaa, jos vektori Tuomme lineaarisen regressioyhtälön matriisimuotoon on esitetty yhtälön jokaisen tuotteen alussa.

Muunnos 1

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Miten se tapahtui? Vastataksesi tähän kysymykseen, katso vain kerrottavien matriisien kokoa ja katso, että tulosteessa saamme luvun tai muuten Tuomme lineaarisen regressioyhtälön matriisimuotoon.

Kirjataan ylös matriisilausekkeiden koot.

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Muunnos 2

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Kirjoitetaan se samalla tavalla kuin muunnos 1

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Lähdössä saamme yhtälön, joka meidän on erotettava:
Tuomme lineaarisen regressioyhtälön matriisimuotoon

Erottelemme mallin laadunarviointitoiminnon

Erotetaan vektorin suhteen Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Kysymykset miksi Tuomme lineaarisen regressioyhtälön matriisimuotoon ei pitäisi olla, mutta tarkastelemme tarkemmin kahden muun lausekkeen derivaattojen määritysoperaatioita.

Erottelu 1

Laajennamme erottelua: Tuomme lineaarisen regressioyhtälön matriisimuotoon

Matriisin tai vektorin derivaatan määrittämiseksi sinun on katsottava, mitä niiden sisällä on. Katsotaan:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon Tuomme lineaarisen regressioyhtälön matriisimuotoon

Merkitään matriisien tuloa Tuomme lineaarisen regressioyhtälön matriisimuotoon matriisin kautta Tuomme lineaarisen regressioyhtälön matriisimuotoon. Matriisi Tuomme lineaarisen regressioyhtälön matriisimuotoon neliö ja lisäksi se on symmetrinen. Nämä ominaisuudet ovat hyödyllisiä meille myöhemmin, muistetaan ne. Matriisi Tuomme lineaarisen regressioyhtälön matriisimuotoon on ulottuvuus Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Nyt tehtävämme on kertoa vektorit oikein matriisilla eikä saada "kaksi kertaa kaksi on viisi", joten keskitytään ja ollaan erittäin varovaisia.

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Olemme kuitenkin saavuttaneet monimutkaisen ilmeen! Itse asiassa meillä on numero - skalaari. Ja nyt todellakin siirrymme erotteluun. On tarpeen löytää tuloksena olevan lausekkeen derivaatta jokaiselle kertoimelle Tuomme lineaarisen regressioyhtälön matriisimuotoon ja saada dimensiovektori tulosteena Tuomme lineaarisen regressioyhtälön matriisimuotoon. Varmuuden vuoksi kirjoitan ylös menettelyt toimenpitein:

1) erottaa Tuomme lineaarisen regressioyhtälön matriisimuotoon, saamme: Tuomme lineaarisen regressioyhtälön matriisimuotoon

2) erottaa Tuomme lineaarisen regressioyhtälön matriisimuotoon, saamme: Tuomme lineaarisen regressioyhtälön matriisimuotoon

3) erottaa Tuomme lineaarisen regressioyhtälön matriisimuotoon, saamme: Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tulos on luvattu koon vektori Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Jos katsot vektoria tarkemmin, huomaat, että vektorin vasen ja vastaava oikea elementti voidaan ryhmitellä siten, että tuloksena vektori voidaan eristää esitetystä vektorista Tuomme lineaarisen regressioyhtälön matriisimuotoon koko Tuomme lineaarisen regressioyhtälön matriisimuotoon. Esimerkiksi Tuomme lineaarisen regressioyhtälön matriisimuotoon (vektorin ylärivin vasen elementti) Tuomme lineaarisen regressioyhtälön matriisimuotoon (vektorin ylärivin oikea elementti) voidaan esittää muodossa Tuomme lineaarisen regressioyhtälön matriisimuotoonJa Tuomme lineaarisen regressioyhtälön matriisimuotoon - kuten Tuomme lineaarisen regressioyhtälön matriisimuotoon jne. jokaisella rivillä. Ryhmään:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Otetaan vektori pois Tuomme lineaarisen regressioyhtälön matriisimuotoon ja ulostulossa saamme:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Katsotaanpa nyt saatua matriisia lähemmin. Matriisi on kahden matriisin summa Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Muistakaamme, että hieman aikaisemmin huomasimme yhden tärkeän matriisin ominaisuuden Tuomme lineaarisen regressioyhtälön matriisimuotoon - se on symmetrinen. Tämän ominaisuuden perusteella voimme luottavaisesti sanoa, että ilmaisu Tuomme lineaarisen regressioyhtälön matriisimuotoon on yhtä suuri kuin Tuomme lineaarisen regressioyhtälön matriisimuotoon. Tämä voidaan helposti varmistaa laajentamalla matriisien tuloa elementti kerrallaan Tuomme lineaarisen regressioyhtälön matriisimuotoon. Emme tee tätä täällä, kiinnostuneet voivat tarkistaa asian itse.

Palataan ilmaisuumme. Muutostemme jälkeen se osoittautui sellaiseksi kuin halusimme sen nähdä:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Olemme siis saaneet ensimmäisen erottelun valmiiksi. Siirrytään toiseen lauseeseen.

Erottelu 2

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Seurataan soitettua polkua. Se on paljon lyhyempi kuin edellinen, joten älä mene liian kauas näytöstä.

Laajennetaan vektoreita ja matriisia elementeiltä:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Poistetaan nämä kaksi hetkeksi laskelmista - sillä ei ole suurta merkitystä, sitten laitetaan se takaisin paikoilleen. Kerrotaan vektorit matriisilla. Ensinnäkin kerrotaan matriisi Tuomme lineaarisen regressioyhtälön matriisimuotoon vektoriin Tuomme lineaarisen regressioyhtälön matriisimuotoon, meillä ei ole täällä rajoituksia. Saamme kokovektorin Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Suoritetaan seuraava toimenpide - kerrotaan vektori Tuomme lineaarisen regressioyhtälön matriisimuotoon tuloksena olevaan vektoriin. Uloskäynnissä meitä odottaa numero:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Sitten erotamme sen. Lähdössä saamme ulottuvuuden vektorin Tuomme lineaarisen regressioyhtälön matriisimuotoon:

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Muistuttaako minua jostain? Oikein! Tämä on matriisin tulos Tuomme lineaarisen regressioyhtälön matriisimuotoon vektoriin Tuomme lineaarisen regressioyhtälön matriisimuotoon.

Siten toinen erottelu on suoritettu onnistuneesti.

Sen sijaan johtopäätös

Nyt tiedämme, miten tasa-arvo syntyi Tuomme lineaarisen regressioyhtälön matriisimuotoon.

Lopuksi kuvataan nopea tapa muuttaa peruskaavoja.

Arvioidaan mallin laatu pienimmän neliösumman menetelmällä:
Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Erotetaan tuloksena oleva lauseke:
Tuomme lineaarisen regressioyhtälön matriisimuotoon Tuomme lineaarisen regressioyhtälön matriisimuotoon

Tuomme lineaarisen regressioyhtälön matriisimuotoon

Kirjallisuus

Internetin lähteet:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Oppikirjoja, tehtäväkokoelmia:

1) Korkeamman matematiikan luentomuistiinpanot: koko kurssi / D.T. Kirjoitettu – 4. painos. – M.: Iris-press, 2006
2) Sovellettu regressioanalyysi / N. Draper, G. Smith - 2. painos. – M.: Finance and Statistics, 1986 (käännös englannista)
3) Tehtäviä matriisiyhtälöiden ratkaisemiseksi:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Lähde: will.com

Lisää kommentti