Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Formålet med artikkelen er å gi støtte til begynnende dataforskere. I forrige artikkel Vi har skissert tre måter å løse en lineær regresjonsligning på: analytisk løsning, gradientnedstigning, stokastisk gradientnedstigning. Så for den analytiske løsningen brukte vi formelen Vi bringer den lineære regresjonsligningen til matriseform. I denne artikkelen, som tittelen antyder, vil vi rettferdiggjøre bruken av denne formelen, eller med andre ord, vi vil utlede den selv.

Hvorfor det er fornuftig å være ekstra oppmerksom på formelen Vi bringer den lineære regresjonsligningen til matriseform?

Det er med matriseligningen man i de fleste tilfeller begynner å bli kjent med lineær regresjon. Samtidig er detaljerte beregninger av hvordan formelen ble utledet sjeldne.

For eksempel, i maskinlæringskurs fra Yandex, når studenter blir introdusert for regularisering, tilbys de å bruke funksjoner fra biblioteket lære, mens ikke et ord er nevnt om matrisepresentasjonen av algoritmen. Det er i dette øyeblikk at noen lyttere kanskje vil forstå dette problemet mer detaljert - skriv kode uten å bruke ferdige funksjoner. Og for å gjøre dette, må du først presentere ligningen med en regularizer i matriseform. Denne artikkelen vil tillate de som ønsker å mestre slike ferdigheter. La oss komme i gang.

Innledende forhold

Målindikatorer

Vi har en rekke målverdier. Målindikatoren kan for eksempel være prisen på en hvilken som helst eiendel: olje, gull, hvete, dollar, etc. Samtidig mener vi med en rekke målindikatorverdier antall observasjoner. Slike observasjoner kan for eksempel være månedlige oljepriser for året, det vil si at vi vil ha 12 målverdier. La oss begynne å introdusere notasjonen. La oss betegne hver verdi av målindikatoren som Vi bringer den lineære regresjonsligningen til matriseform. Totalt har vi Vi bringer den lineære regresjonsligningen til matriseform observasjoner, som betyr at vi kan representere våre observasjoner som Vi bringer den lineære regresjonsligningen til matriseform.

Regressorer

Vi vil anta at det er faktorer som til en viss grad forklarer verdiene til målindikatoren. For eksempel er dollar/rubelkursen sterkt påvirket av oljeprisen, Federal Reserve-kursen osv. Slike faktorer kalles regressorer. Samtidig må hver målindikatorverdi tilsvare en regressorverdi, det vil si at hvis vi har 12 målindikatorer for hver måned i 2018, så bør vi også ha 12 regressorverdier for samme periode. La oss betegne verdiene til hver regressor med Vi bringer den lineære regresjonsligningen til matriseform. La det være i vårt tilfelle Vi bringer den lineære regresjonsligningen til matriseform regressorer (dvs. Vi bringer den lineære regresjonsligningen til matriseform faktorer som påvirker målindikatorverdiene). Dette betyr at våre regressorer kan presenteres som følger: for 1. regressor (for eksempel oljeprisen): Vi bringer den lineære regresjonsligningen til matriseform, for den andre regressoren (for eksempel Fed-renten): Vi bringer den lineære regresjonsligningen til matriseform, For "Vi bringer den lineære regresjonsligningen til matriseform-th" regressor: Vi bringer den lineære regresjonsligningen til matriseform

Målindikatorers avhengighet av regressorer

La oss anta at avhengigheten av målindikatoren Vi bringer den lineære regresjonsligningen til matriseform fra regressorer"Vi bringer den lineære regresjonsligningen til matriseformth" observasjonen kan uttrykkes gjennom en lineær regresjonsligning av formen:

Vi bringer den lineære regresjonsligningen til matriseform

Der Vi bringer den lineære regresjonsligningen til matriseform - "Vi bringer den lineære regresjonsligningen til matriseform-th" regressorverdi fra 1 til Vi bringer den lineære regresjonsligningen til matriseform,

Vi bringer den lineære regresjonsligningen til matriseform — antall regressorer fra 1 til Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform — vinkelkoeffisienter, som representerer mengden som den beregnede målindikatoren vil endres med i gjennomsnitt når regressoren endres.

Med andre ord, vi er for alle (unntatt Vi bringer den lineære regresjonsligningen til matriseform) av regressoren bestemmer vi "vår" koeffisient Vi bringer den lineære regresjonsligningen til matriseform, multipliser deretter koeffisientene med verdiene til regressorene "Vi bringer den lineære regresjonsligningen til matriseformth" observasjon, som et resultat får vi en viss tilnærming "Vi bringer den lineære regresjonsligningen til matriseform-th" målindikator.

Derfor må vi velge slike koeffisienter Vi bringer den lineære regresjonsligningen til matriseform, der verdiene til vår tilnærmede funksjon Vi bringer den lineære regresjonsligningen til matriseform vil være plassert så nær målindikatorverdiene som mulig.

Vurdere kvaliteten på den tilnærmede funksjonen

Vi vil bestemme kvalitetsvurderingen av den approksimerende funksjonen ved å bruke minste kvadraters metode. Kvalitetsvurderingsfunksjonen vil i dette tilfellet ha følgende form:

Vi bringer den lineære regresjonsligningen til matriseform

Vi må velge slike verdier av koeffisientene $w$ som verdien for Vi bringer den lineære regresjonsligningen til matriseform vil være den minste.

Konvertering av ligningen til matriseform

Vektor representasjon

Til å begynne med, for å gjøre livet ditt enklere, bør du ta hensyn til den lineære regresjonsligningen og legge merke til at den første koeffisienten Vi bringer den lineære regresjonsligningen til matriseform multipliseres ikke med noen regressor. Samtidig, når vi konverterer dataene til matriseform, vil de ovennevnte omstendighetene alvorlig komplisere beregningene. I denne forbindelse foreslås det å innføre en annen regressor for den første koeffisienten Vi bringer den lineære regresjonsligningen til matriseform og sidestille det med en. Eller rettere sagt, hver "Vi bringer den lineære regresjonsligningen til matriseformlikestille den te verdien av denne regressoren til en - når alt kommer til alt, når det multipliseres med en, vil ingenting endre seg fra synspunktet til resultatet av beregningene, men fra synspunktet til reglene for produktet av matriser, vår pine vil bli betydelig redusert.

Nå, for øyeblikket, for å forenkle materialet, la oss anta at vi bare har en "Vi bringer den lineære regresjonsligningen til matriseform-th" observasjon. Så forestill deg verdiene til regressorene "Vi bringer den lineære regresjonsligningen til matriseform-th" observasjoner som en vektor Vi bringer den lineære regresjonsligningen til matriseform. Vektor Vi bringer den lineære regresjonsligningen til matriseform har dimensjon Vi bringer den lineære regresjonsligningen til matriseformSom er, Vi bringer den lineære regresjonsligningen til matriseform rader og 1 kolonne:

Vi bringer den lineære regresjonsligningen til matriseform

La oss representere de nødvendige koeffisientene som en vektor Vi bringer den lineære regresjonsligningen til matriseform, som har dimensjon Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Lineær regresjonsligning for "Vi bringer den lineære regresjonsligningen til matriseform-th" observasjon vil ha formen:

Vi bringer den lineære regresjonsligningen til matriseform

Funksjonen for å vurdere kvaliteten på en lineær modell vil ha formen:

Vi bringer den lineære regresjonsligningen til matriseform

Vær oppmerksom på at i samsvar med reglene for matrisemultiplikasjon, trengte vi å transponere vektoren Vi bringer den lineære regresjonsligningen til matriseform.

Matriserepresentasjon

Som et resultat av å multiplisere vektorer får vi tallet: Vi bringer den lineære regresjonsligningen til matriseform, som er å forvente. Dette tallet er omtrentlig "Vi bringer den lineære regresjonsligningen til matriseform-th" målindikator. Men vi trenger en tilnærming av ikke bare én målverdi, men alle. For å gjøre dette, la oss skrive ned alt "Vi bringer den lineære regresjonsligningen til matriseform-th" regressorer i matriseformat Vi bringer den lineære regresjonsligningen til matriseform. Den resulterende matrisen har dimensjonen Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Nå vil den lineære regresjonsligningen ha formen:

Vi bringer den lineære regresjonsligningen til matriseform

La oss betegne verdiene til målindikatorer (alle Vi bringer den lineære regresjonsligningen til matriseform) per vektor Vi bringer den lineære regresjonsligningen til matriseform dimensjon Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Nå kan vi skrive ligningen for å vurdere kvaliteten til en lineær modell i matriseformat:

Vi bringer den lineære regresjonsligningen til matriseform

Faktisk, fra denne formelen får vi videre formelen kjent for oss Vi bringer den lineære regresjonsligningen til matriseform

Hvordan gjøres det? Klammerne åpnes, differensiering utføres, de resulterende uttrykkene transformeres osv., og det er akkurat det vi skal gjøre nå.

Matrisetransformasjoner

La oss åpne parentesene

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

La oss utarbeide en ligning for differensiering

For å gjøre dette vil vi utføre noen transformasjoner. I påfølgende beregninger vil det være mer praktisk for oss hvis vektoren Vi bringer den lineære regresjonsligningen til matriseform vil være representert i begynnelsen av hvert produkt i ligningen.

Konvertering 1

Vi bringer den lineære regresjonsligningen til matriseform

Hvordan skjedde det? For å svare på dette spørsmålet, se bare på størrelsene på matrisene som multipliseres og se at ved utgangen får vi et tall eller på annen måte Vi bringer den lineære regresjonsligningen til matriseform.

La oss skrive ned størrelsene på matriseuttrykk.

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Konvertering 2

Vi bringer den lineære regresjonsligningen til matriseform

La oss skrive det på en lignende måte som transformasjon 1

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Ved utgangen får vi en ligning som vi må differensiere:
Vi bringer den lineære regresjonsligningen til matriseform

Vi differensierer modellkvalitetsvurderingsfunksjonen

La oss differensiere med hensyn til vektoren Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Spørsmål hvorfor Vi bringer den lineære regresjonsligningen til matriseform det burde ikke være det, men vi vil undersøke operasjonene for å bestemme derivater i de to andre uttrykkene mer detaljert.

Differensiering 1

La oss utvide differensieringen: Vi bringer den lineære regresjonsligningen til matriseform

For å bestemme den deriverte av en matrise eller vektor, må du se på hva som er inne i dem. La oss se:

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform Vi bringer den lineære regresjonsligningen til matriseform

La oss betegne produktet av matriser Vi bringer den lineære regresjonsligningen til matriseform gjennom matrisen Vi bringer den lineære regresjonsligningen til matriseform. Matrise Vi bringer den lineære regresjonsligningen til matriseform kvadratisk og dessuten er den symmetrisk. Disse egenskapene vil være nyttige for oss senere, la oss huske dem. Matrise Vi bringer den lineære regresjonsligningen til matriseform har dimensjon Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Nå er oppgaven vår å multiplisere vektorene riktig med matrisen og ikke få "to ganger to er fem", så la oss konsentrere oss og være ekstremt forsiktige.

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi har imidlertid oppnådd et intrikat uttrykk! Faktisk fikk vi et tall - en skalar. Og nå, for alvor, går vi videre til differensiering. Det er nødvendig å finne den deriverte av det resulterende uttrykket for hver koeffisient Vi bringer den lineære regresjonsligningen til matriseform og få dimensjonsvektoren som utdata Vi bringer den lineære regresjonsligningen til matriseform. I tilfelle vil jeg skrive ned prosedyrene ved handling:

1) differensiere ved Vi bringer den lineære regresjonsligningen til matriseform, vi får: Vi bringer den lineære regresjonsligningen til matriseform

2) differensiere ved Vi bringer den lineære regresjonsligningen til matriseform, vi får: Vi bringer den lineære regresjonsligningen til matriseform

3) differensiere ved Vi bringer den lineære regresjonsligningen til matriseform, vi får: Vi bringer den lineære regresjonsligningen til matriseform

Utgangen er den lovede vektoren for størrelse Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Hvis du ser nærmere på vektoren, vil du legge merke til at venstre og korresponderende høyre elementer i vektoren kan grupperes på en slik måte at som et resultat kan en vektor isoleres fra den presenterte vektoren Vi bringer den lineære regresjonsligningen til matriseform størrelse Vi bringer den lineære regresjonsligningen til matriseform. For eksempel, Vi bringer den lineære regresjonsligningen til matriseform (venstre element i den øverste linjen i vektoren) Vi bringer den lineære regresjonsligningen til matriseform (det høyre elementet i den øverste linjen i vektoren) kan representeres som Vi bringer den lineære regresjonsligningen til matriseformOg Vi bringer den lineære regresjonsligningen til matriseform - hvordan Vi bringer den lineære regresjonsligningen til matriseform etc. på hver linje. La oss gruppere:

Vi bringer den lineære regresjonsligningen til matriseform

La oss ta ut vektoren Vi bringer den lineære regresjonsligningen til matriseform og ved utgangen får vi:

Vi bringer den lineære regresjonsligningen til matriseform

La oss nå se nærmere på den resulterende matrisen. Matrisen er summen av to matriser Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

La oss huske at litt tidligere la vi merke til en viktig egenskap ved matrisen Vi bringer den lineære regresjonsligningen til matriseform - den er symmetrisk. Basert på denne egenskapen kan vi trygt si at uttrykket Vi bringer den lineære regresjonsligningen til matriseform lik Vi bringer den lineære regresjonsligningen til matriseform. Dette kan enkelt verifiseres ved å utvide produktet av matriser element for element Vi bringer den lineære regresjonsligningen til matriseform. Vi vil ikke gjøre dette her, interesserte kan sjekke det selv.

La oss gå tilbake til uttrykket vårt. Etter våre transformasjoner ble det slik vi ønsket å se det:

Vi bringer den lineære regresjonsligningen til matriseform

Så vi har fullført den første differensieringen. La oss gå videre til det andre uttrykket.

Differensiering 2

Vi bringer den lineære regresjonsligningen til matriseform

La oss følge allfarvei. Den vil være mye kortere enn den forrige, så ikke gå for langt fra skjermen.

La oss utvide vektorene og matrisen element for element:

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

La oss fjerne de to fra beregningene for en stund – det spiller ingen stor rolle, så setter vi det tilbake på plass. La oss multiplisere vektorene med matrisen. Først av alt, la oss multiplisere matrisen Vi bringer den lineære regresjonsligningen til matriseform til vektor Vi bringer den lineære regresjonsligningen til matriseform, vi har ingen begrensninger her. Vi får størrelsesvektoren Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

La oss utføre følgende handling - multipliser vektoren Vi bringer den lineære regresjonsligningen til matriseform til den resulterende vektoren. Ved utgangen vil nummeret vente på oss:

Vi bringer den lineære regresjonsligningen til matriseform

Da skal vi differensiere det. Ved utgangen får vi en vektor av dimensjon Vi bringer den lineære regresjonsligningen til matriseform:

Vi bringer den lineære regresjonsligningen til matriseform

Minner meg om noe? Det er riktig! Dette er produktet av matrisen Vi bringer den lineære regresjonsligningen til matriseform til vektor Vi bringer den lineære regresjonsligningen til matriseform.

Dermed er den andre differensieringen fullført.

I stedet for en konklusjon

Nå vet vi hvordan likestillingen ble til Vi bringer den lineære regresjonsligningen til matriseform.

Til slutt vil vi beskrive en rask måte å transformere grunnleggende formler.

La oss evaluere kvaliteten på modellen i samsvar med minste kvadraters metode:
Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

La oss skille det resulterende uttrykket:
Vi bringer den lineære regresjonsligningen til matriseform Vi bringer den lineære regresjonsligningen til matriseform

Vi bringer den lineære regresjonsligningen til matriseform

Litteratur

Internett-kilder:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Lærebøker, samlinger av problemer:

1) Forelesningsnotater om høyere matematikk: fullt kurs / D.T. Skrevet – 4. utg. – M.: Iris-press, 2006
2) Anvendt regresjonsanalyse / N. Draper, G. Smith - 2. utg. – M.: Finans og statistikk, 1986 (oversettelse fra engelsk)
3) Problemer for å løse matriseligninger:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Kilde: www.habr.com

Legg til en kommentar