Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Formålet med artiklen er at yde støtte til begyndende dataforskere. I forrige artikel Vi har skitseret tre måder at løse en lineær regressionsligning på: analytisk løsning, gradientnedstigning, stokastisk gradientnedstigning. Derefter anvendte vi formlen til den analytiske løsning Vi bringer den lineære regressionsligning på matrixform. I denne artikel, som titlen antyder, vil vi retfærdiggøre brugen af ​​denne formel, eller med andre ord, vi vil udlede den selv.

Hvorfor det giver mening at være ekstra opmærksom på formlen Vi bringer den lineære regressionsligning på matrixform?

Det er med matrixligningen, at man i de fleste tilfælde begynder at stifte bekendtskab med lineær regression. Samtidig er detaljerede beregninger af, hvordan formlen blev udledt, sjældne.

For eksempel, i maskinlæringskurser fra Yandex, når eleverne introduceres til regularisering, tilbydes de at bruge funktioner fra biblioteket lære, mens der ikke nævnes et ord om matrixrepræsentationen af ​​algoritmen. Det er på dette tidspunkt, at nogle lyttere måske ønsker at forstå dette problem mere detaljeret - skriv kode uden at bruge færdige funktioner. Og for at gøre dette skal du først præsentere ligningen med en regularizer i matrixform. Denne artikel vil give dem, der ønsker at mestre sådanne færdigheder. Lad os komme igang.

Oprindelige forhold

Målindikatorer

Vi har en række målværdier. For eksempel kan målindikatoren være prisen på ethvert aktiv: olie, guld, hvede, dollar osv. Samtidig mener vi med en række målindikatorværdier antallet af observationer. Sådanne observationer kunne for eksempel være månedlige oliepriser for året, det vil sige, at vi vil have 12 målværdier. Lad os begynde at introducere notationen. Lad os betegne hver værdi af målindikatoren som Vi bringer den lineære regressionsligning på matrixform. I alt har vi Vi bringer den lineære regressionsligning på matrixform observationer, hvilket betyder, at vi kan repræsentere vores observationer som Vi bringer den lineære regressionsligning på matrixform.

Regressorer

Vi vil antage, at der er faktorer, der til en vis grad forklarer værdierne af målindikatoren. For eksempel er dollar/rubel-kursen stærkt påvirket af olieprisen, Federal Reserve-kursen osv. Sådanne faktorer kaldes regressorer. Samtidig skal hver målindikatorværdi svare til en regressorværdi, det vil sige, hvis vi har 12 målindikatorer for hver måned i 2018, så skal vi også have 12 regressorværdier for samme periode. Lad os betegne værdierne for hver regressor med Vi bringer den lineære regressionsligning på matrixform. Lad der være i vores tilfælde Vi bringer den lineære regressionsligning på matrixform regressorer (dvs. Vi bringer den lineære regressionsligning på matrixform faktorer, der påvirker målindikatorværdierne). Det betyder, at vores regressorer kan præsenteres som følger: for 1. regressor (f.eks. olieprisen): Vi bringer den lineære regressionsligning på matrixform, for den 2. regressor (f.eks. Fed-renten): Vi bringer den lineære regressionsligning på matrixform, Til "Vi bringer den lineære regressionsligning på matrixform-th" regressor: Vi bringer den lineære regressionsligning på matrixform

Målindikatorers afhængighed af regressorer

Lad os antage, at afhængigheden af ​​målindikatoren Vi bringer den lineære regressionsligning på matrixform fra regressorer"Vi bringer den lineære regressionsligning på matrixformth" observation kan udtrykkes gennem en lineær regressionsligning på formen:

Vi bringer den lineære regressionsligning på matrixform

Hvor Vi bringer den lineære regressionsligning på matrixform - "Vi bringer den lineære regressionsligning på matrixform-th" regressorværdi fra 1 til Vi bringer den lineære regressionsligning på matrixform,

Vi bringer den lineære regressionsligning på matrixform — antal regressorer fra 1 til Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform — vinkelkoefficienter, som repræsenterer den mængde, hvormed den beregnede målindikator vil ændre sig i gennemsnit, når regressoren ændres.

Med andre ord, vi er for alle (undtagen Vi bringer den lineære regressionsligning på matrixform) af regressoren bestemmer vi "vores" koefficient Vi bringer den lineære regressionsligning på matrixform, gange derefter koefficienterne med værdierne af regressorerne "Vi bringer den lineære regressionsligning på matrixformth" observation, som et resultat opnår vi en vis tilnærmelse "Vi bringer den lineære regressionsligning på matrixform-th" målindikator.

Derfor skal vi vælge sådanne koefficienter Vi bringer den lineære regressionsligning på matrixform, hvor værdierne af vores tilnærmelsesfunktion Vi bringer den lineære regressionsligning på matrixform vil være placeret så tæt som muligt på målindikatorværdierne.

Vurdering af kvaliteten af ​​den tilnærmede funktion

Vi vil bestemme kvalitetsvurderingen af ​​den approksimerende funktion ved hjælp af mindste kvadraters metode. Kvalitetsvurderingsfunktionen vil i dette tilfælde have følgende form:

Vi bringer den lineære regressionsligning på matrixform

Vi skal vælge sådanne værdier af koefficienterne $w$, som værdien for Vi bringer den lineære regressionsligning på matrixform vil være den mindste.

Konvertering af ligningen til matrixform

Vektor repræsentation

Til at begynde med, for at gøre dit liv lettere, bør du være opmærksom på den lineære regressionsligning og bemærke, at den første koefficient Vi bringer den lineære regressionsligning på matrixform multipliceres ikke med nogen regressor. Når vi samtidig konverterer dataene til matrixform, vil ovennævnte forhold alvorligt komplicere beregningerne. I denne forbindelse foreslås det at indføre en anden regressor for den første koefficient Vi bringer den lineære regressionsligning på matrixform og sidestille det med en. Eller rettere, hver"Vi bringer den lineære regressionsligning på matrixformsidestille den th værdi af denne regressor til en - når alt kommer til alt, når det ganges med en, vil intet ændre sig ud fra synspunktet om resultatet af beregningerne, men fra synspunktet om reglerne for produktet af matricer, vores pine vil blive væsentligt reduceret.

Lad os nu for øjeblikket, for at forenkle materialet, antage, at vi kun har én "Vi bringer den lineære regressionsligning på matrixform-th" observation. Forestil dig derefter regressorernes værdier "Vi bringer den lineære regressionsligning på matrixform-th" observationer som en vektor Vi bringer den lineære regressionsligning på matrixform. Vektor Vi bringer den lineære regressionsligning på matrixform har dimension Vi bringer den lineære regressionsligning på matrixformDet vil sige, Vi bringer den lineære regressionsligning på matrixform rækker og 1 kolonne:

Vi bringer den lineære regressionsligning på matrixform

Lad os repræsentere de nødvendige koefficienter som en vektor Vi bringer den lineære regressionsligning på matrixform, der har dimension Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Lineær regressionsligning for "Vi bringer den lineære regressionsligning på matrixform-th" observation vil have formen:

Vi bringer den lineære regressionsligning på matrixform

Funktionen til at vurdere kvaliteten af ​​en lineær model vil tage formen:

Vi bringer den lineære regressionsligning på matrixform

Bemærk venligst, at i overensstemmelse med reglerne for matrixmultiplikation var vi nødt til at transponere vektoren Vi bringer den lineære regressionsligning på matrixform.

Matrix repræsentation

Som et resultat af at gange vektorer får vi tallet: Vi bringer den lineære regressionsligning på matrixform, hvilket må forventes. Dette tal er tilnærmelsen "Vi bringer den lineære regressionsligning på matrixform-th" målindikator. Men vi har brug for en tilnærmelse af ikke kun én målværdi, men dem alle. For at gøre dette, lad os skrive alt ned "Vi bringer den lineære regressionsligning på matrixform"th" regressorer i matrixformat Vi bringer den lineære regressionsligning på matrixform. Den resulterende matrix har dimensionen Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Nu vil den lineære regressionsligning have formen:

Vi bringer den lineære regressionsligning på matrixform

Lad os betegne værdierne for målindikatorer (alle Vi bringer den lineære regressionsligning på matrixform) pr. vektor Vi bringer den lineære regressionsligning på matrixform dimension Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Nu kan vi skrive ligningen for at vurdere kvaliteten af ​​en lineær model i matrixformat:

Vi bringer den lineære regressionsligning på matrixform

Faktisk opnår vi fra denne formel yderligere den formel, vi kender Vi bringer den lineære regressionsligning på matrixform

Hvordan gøres det? Klammerne åbnes, differentiering udføres, de resulterende udtryk transformeres osv., og det er præcis, hvad vi vil gøre nu.

Matrix transformationer

Lad os åbne parenteserne

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Lad os udarbejde en ligning for differentiering

For at gøre dette vil vi udføre nogle transformationer. I efterfølgende beregninger vil det være mere bekvemt for os, hvis vektoren Vi bringer den lineære regressionsligning på matrixform vil være repræsenteret i begyndelsen af ​​hvert produkt i ligningen.

Konvertering 1

Vi bringer den lineære regressionsligning på matrixform

Hvordan skete det? For at besvare dette spørgsmål skal du bare se på størrelserne af de matricer, der ganges og se, at ved outputtet får vi et tal eller andet Vi bringer den lineære regressionsligning på matrixform.

Lad os nedskrive størrelsen af ​​matrixudtryk.

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Konvertering 2

Vi bringer den lineære regressionsligning på matrixform

Lad os skrive det på samme måde som transformation 1

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Ved output får vi en ligning, som vi skal differentiere:
Vi bringer den lineære regressionsligning på matrixform

Vi differentierer modellens kvalitetsvurderingsfunktion

Lad os differentiere med hensyn til vektoren Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Spørgsmål hvorfor Vi bringer den lineære regressionsligning på matrixform det burde der ikke være, men vi vil undersøge operationerne til bestemmelse af derivater i de to andre udtryk mere detaljeret.

Differentiering 1

Lad os udvide med differentieringen: Vi bringer den lineære regressionsligning på matrixform

For at bestemme derivatet af en matrix eller vektor skal du se på, hvad der er inde i dem. Lad os se:

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform Vi bringer den lineære regressionsligning på matrixform

Lad os betegne produktet af matricer Vi bringer den lineære regressionsligning på matrixform gennem matrixen Vi bringer den lineære regressionsligning på matrixform. Matrix Vi bringer den lineære regressionsligning på matrixform kvadratisk og desuden er den symmetrisk. Disse egenskaber vil være nyttige for os senere, lad os huske dem. Matrix Vi bringer den lineære regressionsligning på matrixform har dimension Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Nu er vores opgave at gange vektorerne korrekt med matrixen og ikke få "to gange to er fem", så lad os koncentrere os og være ekstremt forsigtige.

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi har dog opnået et indviklet udtryk! Faktisk fik vi et nummer - en skalar. Og nu går vi for alvor videre til differentiering. Det er nødvendigt at finde derivatet af det resulterende udtryk for hver koefficient Vi bringer den lineære regressionsligning på matrixform og få dimensionsvektoren som output Vi bringer den lineære regressionsligning på matrixform. For en sikkerheds skyld vil jeg nedskrive procedurerne ved handling:

1) differentiere ved Vi bringer den lineære regressionsligning på matrixform, vi får: Vi bringer den lineære regressionsligning på matrixform

2) differentiere ved Vi bringer den lineære regressionsligning på matrixform, vi får: Vi bringer den lineære regressionsligning på matrixform

3) differentiere ved Vi bringer den lineære regressionsligning på matrixform, vi får: Vi bringer den lineære regressionsligning på matrixform

Outputtet er den lovede vektor af størrelse Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Hvis du ser nærmere på vektoren, vil du bemærke, at vektorens venstre og tilsvarende højre elementer kan grupperes på en sådan måde, at en vektor som et resultat kan isoleres fra den præsenterede vektor Vi bringer den lineære regressionsligning på matrixform størrelsen Vi bringer den lineære regressionsligning på matrixform. For eksempel Vi bringer den lineære regressionsligning på matrixform (venstre element i vektorens øverste linje) Vi bringer den lineære regressionsligning på matrixform (det højre element i vektorens øverste linje) kan repræsenteres som Vi bringer den lineære regressionsligning på matrixformOg Vi bringer den lineære regressionsligning på matrixform - som Vi bringer den lineære regressionsligning på matrixform etc. på hver linje. Lad os gruppere:

Vi bringer den lineære regressionsligning på matrixform

Lad os tage vektoren ud Vi bringer den lineære regressionsligning på matrixform og ved udgangen får vi:

Vi bringer den lineære regressionsligning på matrixform

Lad os nu se nærmere på den resulterende matrix. Matrixen er summen af ​​to matricer Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Lad os huske på, at vi lidt tidligere bemærkede en vigtig egenskab ved matricen Vi bringer den lineære regressionsligning på matrixform - den er symmetrisk. Baseret på denne egenskab, kan vi trygt sige, at udtrykket Vi bringer den lineære regressionsligning på matrixform lig Vi bringer den lineære regressionsligning på matrixform. Dette kan nemt verificeres ved at udvide produktet af matricer element for element Vi bringer den lineære regressionsligning på matrixform. Det gør vi ikke her, interesserede kan selv tjekke det.

Lad os vende tilbage til vores udtryk. Efter vores transformationer blev det, som vi ønskede at se det:

Vi bringer den lineære regressionsligning på matrixform

Så vi har afsluttet den første differentiering. Lad os gå videre til det andet udtryk.

Differentiering 2

Vi bringer den lineære regressionsligning på matrixform

Lad os følge den slagne vej. Den bliver meget kortere end den forrige, så gå ikke for langt fra skærmen.

Lad os udvide vektorerne og matrixen element for element:

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Lad os fjerne de to fra beregningerne for en stund – det spiller ikke den store rolle, så sætter vi det på plads igen. Lad os gange vektorerne med matrixen. Først og fremmest, lad os gange matrixen Vi bringer den lineære regressionsligning på matrixform til vektor Vi bringer den lineære regressionsligning på matrixform, vi har ingen begrænsninger her. Vi får størrelsesvektoren Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Lad os udføre følgende handling - gange vektoren Vi bringer den lineære regressionsligning på matrixform til den resulterende vektor. Ved udgangen venter nummeret på os:

Vi bringer den lineære regressionsligning på matrixform

Så vil vi differentiere det. Ved udgangen får vi en vektor af dimension Vi bringer den lineære regressionsligning på matrixform:

Vi bringer den lineære regressionsligning på matrixform

Minder mig om noget? Det er rigtigt! Dette er produktet af matrixen Vi bringer den lineære regressionsligning på matrixform til vektor Vi bringer den lineære regressionsligning på matrixform.

Således er den anden differentiering gennemført med succes.

I stedet for en konklusion

Nu ved vi, hvordan ligestillingen opstod Vi bringer den lineære regressionsligning på matrixform.

Til sidst vil vi beskrive en hurtig måde at transformere grundlæggende formler på.

Lad os evaluere kvaliteten af ​​modellen i overensstemmelse med mindste kvadraters metode:
Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Lad os differentiere det resulterende udtryk:
Vi bringer den lineære regressionsligning på matrixform Vi bringer den lineære regressionsligning på matrixform

Vi bringer den lineære regressionsligning på matrixform

Litteratur

Internetkilder:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Lærebøger, samlinger af problemer:

1) Forelæsningsnotater om højere matematik: fuldt kursus / D.T. Skrevet – 4. udg. – M.: Iris-press, 2006
2) Anvendt regressionsanalyse / N. Draper, G. Smith - 2. udg. – M.: Finans og statistik, 1986 (oversættelse fra engelsk)
3) Problemer til løsning af matrixligninger:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Kilde: www.habr.com

Tilføj en kommentar