Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Namen članka je zagotoviti podporo začetnikom podatkovnih znanstvenikov. IN prejšnji članek Opisali smo tri načine za rešitev enačbe linearne regresije: analitično rešitev, gradientni spust, stohastični gradientni spust. Nato smo za analitično rešitev uporabili formulo Enačbo linearne regresije spravimo v matrično obliko. V tem prispevku bomo, kot že naslov pove, utemeljili uporabo te formule oziroma jo bomo izpeljali sami.

Zakaj je smiselno nameniti dodatno pozornost formuli Enačbo linearne regresije spravimo v matrično obliko?

Z matrično enačbo se v večini primerov začnemo seznanjati z linearno regresijo. Hkrati so podrobni izračuni, kako je bila formula izpeljana, redki.

Na primer, pri tečajih strojnega učenja iz Yandexa, ko se študenti seznanijo z zakonodajo, jim ponudijo uporabo funkcij iz knjižnice sklearn, medtem ko o matrični predstavitvi algoritma ni omenjena nobena beseda. V tem trenutku bodo morda nekateri poslušalci želeli podrobneje razumeti to težavo - napisati kodo brez uporabe že pripravljenih funkcij. Če želite to narediti, morate enačbo najprej predstaviti z regulatorjem v matrični obliki. Ta članek bo tistim, ki želijo obvladati te veščine, omogočil. Začnimo.

Začetni pogoji

Ciljni kazalniki

Imamo vrsto ciljnih vrednosti. Ciljni indikator je lahko na primer cena katerega koli sredstva: nafte, zlata, pšenice, dolarja itd. Hkrati s številom vrednosti ciljnih indikatorjev mislimo na število opazovanj. Takšna opazovanja so lahko na primer mesečne cene nafte za leto, torej bomo imeli 12 ciljnih vrednosti. Začnimo z uvajanjem notacije. Vsako vrednost ciljnega indikatorja označimo kot Enačbo linearne regresije spravimo v matrično obliko. Skupaj imamo Enačbo linearne regresije spravimo v matrično obliko opazovanja, kar pomeni, da lahko svoja opažanja predstavimo kot Enačbo linearne regresije spravimo v matrično obliko.

Regresorji

Predvidevamo, da obstajajo dejavniki, ki do določene mere pojasnjujejo vrednosti ciljnega kazalnika. Na primer, menjalni tečaj dolar/rubelj je pod močnim vplivom cene nafte, tečaja Federal Reserve itd. Takšni dejavniki se imenujejo regresorji. Hkrati mora vsaka ciljna vrednost kazalnika ustrezati regresorski vrednosti, to je, če imamo 12 ciljnih kazalnikov za vsak mesec v letu 2018, potem bi morali imeti tudi 12 regresorskih vrednosti za isto obdobje. Označimo vrednosti vsakega regresorja z Enačbo linearne regresije spravimo v matrično obliko. Naj v našem primeru obstaja Enačbo linearne regresije spravimo v matrično obliko regresorji (tj. Enačbo linearne regresije spravimo v matrično obliko dejavniki, ki vplivajo na ciljne vrednosti indikatorjev). To pomeni, da lahko naše regresorje predstavimo takole: za 1. regresor (na primer cena nafte): Enačbo linearne regresije spravimo v matrično obliko, za 2. regresor (na primer obrestna mera Fed): Enačbo linearne regresije spravimo v matrično obliko, Za "Enačbo linearne regresije spravimo v matrično obliko-th" regresor: Enačbo linearne regresije spravimo v matrično obliko

Odvisnost ciljnih kazalnikov od regresorjev

Predpostavimo, da je odvisnost ciljnega indikatorja Enačbo linearne regresije spravimo v matrično obliko od regresorjev"Enačbo linearne regresije spravimo v matrično oblikoth" opazovanje lahko izrazimo z linearno regresijsko enačbo v obliki:

Enačbo linearne regresije spravimo v matrično obliko

Če Enačbo linearne regresije spravimo v matrično obliko - "Enačbo linearne regresije spravimo v matrično obliko-th" vrednost regresorja od 1 do Enačbo linearne regresije spravimo v matrično obliko,

Enačbo linearne regresije spravimo v matrično obliko — število regresorjev od 1 do Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko — kotni koeficienti, ki predstavljajo količino, za katero se bo v povprečju spremenil izračunani ciljni kazalnik ob spremembi regresorja.

Z drugimi besedami, smo za vse (razen Enačbo linearne regresije spravimo v matrično obliko) regresorja določimo »naš« koeficient Enačbo linearne regresije spravimo v matrično obliko, nato pomnožite koeficiente z vrednostmi regresorjev "Enačbo linearne regresije spravimo v matrično oblikoth" opazovanja, kot rezultat dobimo določen približek "Enačbo linearne regresije spravimo v matrično obliko-th« indikator cilja.

Zato moramo izbrati takšne koeficiente Enačbo linearne regresije spravimo v matrično obliko, pri kateri so vrednosti naše aproksimacijske funkcije Enačbo linearne regresije spravimo v matrično obliko bo čim bližje ciljnim vrednostim indikatorja.

Ocenjevanje kakovosti aproksimacijske funkcije

Oceno kakovosti aproksimacijske funkcije bomo določili z metodo najmanjših kvadratov. Funkcija ocenjevanja kakovosti bo v tem primeru imela naslednjo obliko:

Enačbo linearne regresije spravimo v matrično obliko

Izbrati moramo takšne vrednosti koeficientov $w$, za katere je vrednost Enačbo linearne regresije spravimo v matrično obliko bo najmanjši.

Pretvorba enačbe v matrično obliko

Vektorska predstavitev

Za začetek, da bi si olajšali življenje, bodite pozorni na enačbo linearne regresije in opazite, da prvi koeficient Enačbo linearne regresije spravimo v matrično obliko ni pomnožen z nobenim regresorjem. Obenem pa bo zgoraj omenjena okoliščina pri pretvarjanju podatkov v matrično obliko močno otežila izračune. V zvezi s tem se predlaga uvedba drugega regresorja za prvi koeficient Enačbo linearne regresije spravimo v matrično obliko in ga enači z eno. Oziroma vsak "Enačbo linearne regresije spravimo v matrično oblikoizenačite th vrednost tega regresorja z ena - navsezadnje se, ko se pomnoži z ena, ne bo nič spremenilo z vidika rezultata izračunov, ampak z vidika pravil za produkt matrik, naše muke se bo znatno zmanjšalo.

Zaenkrat, da bi poenostavili gradivo, predpostavimo, da imamo samo eno "Enačbo linearne regresije spravimo v matrično obliko-th« opazovanje. Nato si predstavljajte vrednosti regresorjev "Enačbo linearne regresije spravimo v matrično obliko-th" opazovanja kot vektor Enačbo linearne regresije spravimo v matrično obliko. Vektor Enačbo linearne regresije spravimo v matrično obliko ima dimenzijo Enačbo linearne regresije spravimo v matrično oblikoTo pomeni, da Enačbo linearne regresije spravimo v matrično obliko vrstice in 1 stolpec:

Enačbo linearne regresije spravimo v matrično obliko

Predstavimo zahtevane koeficiente kot vektor Enačbo linearne regresije spravimo v matrično obliko, ki ima dimenzijo Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Enačba linearne regresije za "Enačbo linearne regresije spravimo v matrično obliko-th" opazovanje bo v obliki:

Enačbo linearne regresije spravimo v matrično obliko

Funkcija za ocenjevanje kakovosti linearnega modela bo imela obliko:

Enačbo linearne regresije spravimo v matrično obliko

Upoštevajte, da smo morali v skladu s pravili množenja matrik transponirati vektor Enačbo linearne regresije spravimo v matrično obliko.

Matrična predstavitev

Kot rezultat množenja vektorjev dobimo število: Enačbo linearne regresije spravimo v matrično obliko, kar je pričakovano. Ta številka je približek "Enačbo linearne regresije spravimo v matrično obliko-th« indikator cilja. Vendar ne potrebujemo približka le ene ciljne vrednosti, ampak vseh. Če želite to narediti, zapišimo vse "Enačbo linearne regresije spravimo v matrično obliko-th" regresorji v matričnem formatu Enačbo linearne regresije spravimo v matrično obliko. Nastala matrika ima dimenzijo Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Zdaj bo linearna regresijska enačba imela obliko:

Enačbo linearne regresije spravimo v matrično obliko

Označimo vrednosti ciljnih kazalnikov (vsi Enačbo linearne regresije spravimo v matrično obliko) na vektor Enačbo linearne regresije spravimo v matrično obliko razsežnost Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Sedaj lahko zapišemo enačbo za oceno kakovosti linearnega modela v matrični obliki:

Enačbo linearne regresije spravimo v matrično obliko

Pravzaprav iz te formule nadalje dobimo nam znano formulo Enačbo linearne regresije spravimo v matrično obliko

Kako se to naredi? Odprejo se oklepaji, izvede se diferenciacija, preoblikujejo dobljeni izrazi itd., in prav to bomo zdaj storili.

Matrične transformacije

Odprimo oklepaje

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Pripravimo enačbo za diferenciacijo

Da bi to naredili, bomo izvedli nekaj transformacij. Pri nadaljnjih izračunih nam bo bolj priročno, če vektor Enačbo linearne regresije spravimo v matrično obliko bo predstavljen na začetku vsakega produkta v enačbi.

Pretvorba 1

Enačbo linearne regresije spravimo v matrično obliko

Kako se je to zgodilo? Če želite odgovoriti na to vprašanje, samo poglejte velikosti matrik, ki se množijo, in videli boste, da na izhodu dobimo število ali drugače Enačbo linearne regresije spravimo v matrično obliko.

Zapišimo velikosti matričnih izrazov.

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Pretvorba 2

Enačbo linearne regresije spravimo v matrično obliko

Zapišimo ga na podoben način kot transformacijo 1

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Na izhodu dobimo enačbo, ki jo moramo razlikovati:
Enačbo linearne regresije spravimo v matrično obliko

Razlikujemo funkcijo ocenjevanja kakovosti modela

Razlikujmo glede na vektor Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Vprašanja zakaj Enačbo linearne regresije spravimo v matrično obliko ne bi smelo biti, bomo pa podrobneje preučili operacije za določanje odvodov v drugih dveh izrazih.

Diferenciacija 1

Razširimo diferenciacijo: Enačbo linearne regresije spravimo v matrično obliko

Če želite določiti izpeljanko matrike ali vektorja, morate pogledati, kaj je v njih. Poglejmo:

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko Enačbo linearne regresije spravimo v matrično obliko

Označimo produkt matrik Enačbo linearne regresije spravimo v matrično obliko skozi matrico Enačbo linearne regresije spravimo v matrično obliko. Matrix Enačbo linearne regresije spravimo v matrično obliko kvadraten in poleg tega je simetričen. Te lastnosti nam bodo kasneje koristile, zapomnimo si jih. Matrix Enačbo linearne regresije spravimo v matrično obliko ima dimenzijo Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Zdaj je naša naloga pravilno pomnožiti vektorje z matriko in ne dobiti "dvakrat dva je pet", zato se osredotočimo in bodimo zelo previdni.

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Vendar smo dosegli zapleten izraz! Pravzaprav smo dobili število – skalar. In zdaj, zares, preidimo na diferenciacijo. Za vsak koeficient je treba najti izpeljanko dobljenega izraza Enačbo linearne regresije spravimo v matrično obliko in dobite dimenzijski vektor kot izhod Enačbo linearne regresije spravimo v matrično obliko. Za vsak slučaj bom zapisal postopke po dejanjih:

1) razlikovati po Enačbo linearne regresije spravimo v matrično obliko, dobimo: Enačbo linearne regresije spravimo v matrično obliko

2) razlikovati po Enačbo linearne regresije spravimo v matrično obliko, dobimo: Enačbo linearne regresije spravimo v matrično obliko

3) razlikovati po Enačbo linearne regresije spravimo v matrično obliko, dobimo: Enačbo linearne regresije spravimo v matrično obliko

Rezultat je obljubljeni vektor velikosti Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Če pogledate vektor podrobneje, boste opazili, da lahko levi in ​​ustrezni desni element vektorja združimo tako, da lahko posledično ločimo vektor od predstavljenega vektorja Enačbo linearne regresije spravimo v matrično obliko velikosti Enačbo linearne regresije spravimo v matrično obliko. Na primer Enačbo linearne regresije spravimo v matrično obliko (levi element zgornje vrstice vektorja) Enačbo linearne regresije spravimo v matrično obliko (desni element zgornje vrstice vektorja) lahko predstavimo kot Enačbo linearne regresije spravimo v matrično oblikoIn Enačbo linearne regresije spravimo v matrično obliko - kako Enačbo linearne regresije spravimo v matrično obliko itd. na vsaki vrstici. Združimo:

Enačbo linearne regresije spravimo v matrično obliko

Vzemimo vektor Enačbo linearne regresije spravimo v matrično obliko in na izhodu dobimo:

Enačbo linearne regresije spravimo v matrično obliko

Zdaj pa si podrobneje oglejmo nastalo matriko. Matrika je vsota dveh matrik Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Spomnimo se, da smo malo prej opazili eno pomembno lastnost matrike Enačbo linearne regresije spravimo v matrično obliko - je simetrična. Na podlagi te lastnosti lahko z gotovostjo trdimo, da izraz Enačbo linearne regresije spravimo v matrično obliko enako Enačbo linearne regresije spravimo v matrično obliko. To je mogoče enostavno preveriti z razširitvijo produkta matrik po elementih Enačbo linearne regresije spravimo v matrično obliko. Tukaj tega ne bomo počeli, zainteresirani lahko preverijo sami.

Vrnimo se k našemu izrazu. Po naših preobrazbah je izpadlo tako, kot smo si želeli videti:

Enačbo linearne regresije spravimo v matrično obliko

Tako smo končali prvo diferenciacijo. Pojdimo k drugemu izrazu.

Diferenciacija 2

Enačbo linearne regresije spravimo v matrično obliko

Gremo po uhojeni poti. Bo precej krajši od prejšnjega, zato se ne oddaljujte predaleč od zaslona.

Razširimo vektorje in matriko element za elementom:

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

To dvoje za nekaj časa odstranimo iz izračunov - ne igra velike vloge, potem pa ga bomo postavili nazaj na svoje mesto. Pomnožimo vektorje z matriko. Najprej pomnožimo matriko Enačbo linearne regresije spravimo v matrično obliko v vektor Enačbo linearne regresije spravimo v matrično obliko, tukaj nimamo nobenih omejitev. Dobimo vektor velikosti Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Izvedimo naslednje dejanje - pomnožimo vektor Enačbo linearne regresije spravimo v matrično obliko do nastalega vektorja. Na izhodu nas bo pričakala številka:

Enačbo linearne regresije spravimo v matrično obliko

Potem ga bomo razlikovali. Na izhodu dobimo vektor dimenzije Enačbo linearne regresije spravimo v matrično obliko:

Enačbo linearne regresije spravimo v matrično obliko

Me spominja na kaj? Tako je! To je produkt matrice Enačbo linearne regresije spravimo v matrično obliko v vektor Enačbo linearne regresije spravimo v matrično obliko.

Tako je druga diferenciacija uspešno zaključena.

Namesto zaključka

Zdaj vemo, kako je prišlo do enakosti Enačbo linearne regresije spravimo v matrično obliko.

Na koncu bomo opisali hiter način preoblikovanja osnovnih formul.

Ocenimo kakovost modela po metodi najmanjših kvadratov:
Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Razlikujmo nastali izraz:
Enačbo linearne regresije spravimo v matrično obliko Enačbo linearne regresije spravimo v matrično obliko

Enačbo linearne regresije spravimo v matrično obliko

Literatura

Internetni viri:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Učbeniki, zbirke nalog:

1) Zapiski predavanj o višji matematiki: celoten tečaj / D.T. Napisano – 4. izd. – M.: Iris-press, 2006
2) Uporabljena regresijska analiza / N. Draper, G. Smith - 2. izd. – M.: Finance in statistika, 1986 (prevod iz angleščine)
3) Problemi za reševanje matričnih enačb:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Vir: www.habr.com

Dodaj komentar