🥇Låt oss omvandla den linjära regressionsekvationen till matrisform

Vi tar den linjära regressionsekvationen till matrisform

Syftet med artikeln är att ge stöd till nybörjare dataforskare. I tidigare artikel Vi har skisserat tre sätt att lösa en linjär regressionsekvation: analytisk lösning, gradientnedstigning, stokastisk gradientnedstigning. Sedan använde vi formeln för den analytiska lösningen Vi tar den linjära regressionsekvationen till matrisform . I den här artikeln, som titeln antyder, kommer vi att motivera användningen av denna formel, eller med andra ord, vi kommer att härleda den själva.

Varför det är vettigt att vara extra uppmärksam på formeln Vi tar den linjära regressionsekvationen till matrisform ?

Det är med matrisekvationen som man i de flesta fall börjar bekanta sig med linjär regression. Samtidigt är detaljerade beräkningar av hur formeln härleddes sällsynta.

Till exempel, i maskininlärningskurser från Yandex, när eleverna introduceras till regularisering, erbjuds de att använda funktioner från biblioteket lära sig, medan inte ett ord nämns om matrisrepresentationen av algoritmen. Det är i detta ögonblick som vissa lyssnare kanske vill förstå detta problem mer i detalj - skriv kod utan att använda färdiga funktioner. Och för att göra detta måste du först presentera ekvationen med en regularizer i matrisform. Den här artikeln kommer att tillåta dem som vill behärska sådana färdigheter. Låt oss börja.

Initiala förhållanden

Målindikatorer

Vi har en rad målvärden. Till exempel kan målindikatorn vara priset på alla tillgångar: olja, guld, vete, dollar, etc. Samtidigt menar vi med ett antal målindikatorvärden antalet observationer. Sådana observationer kan till exempel vara månatliga oljepriser för året, det vill säga vi kommer att ha 12 målvärden. Låt oss börja introducera notationen. Låt oss beteckna varje värde på målindikatorn som Vi tar den linjära regressionsekvationen till matrisform . Totalt har vi observationer, vilket betyder att vi kan representera våra observationer som .

Regressorer

Vi kommer att anta att det finns faktorer som till viss del förklarar målindikatorns värden. Till exempel är växelkursen dollar/rubel starkt påverkad av oljepriset, Federal Reserve-kursen etc. Sådana faktorer kallas regressorer. Samtidigt måste varje målindikatorvärde motsvara ett regressorvärde, det vill säga om vi har 12 målindikatorer för varje månad under 2018, så bör vi också ha 12 regressorvärden för samma period. Låt oss beteckna värdena för varje regressor med Vi tar den linjära regressionsekvationen till matrisform . Låt det i vårt fall finnas regressorer (dvs. faktorer som påverkar målindikatorvärdena). Detta innebär att våra regressorer kan presenteras enligt följande: för den 1:a regressorn (till exempel oljepriset): , för den andra regressorn (till exempel Fed-räntan): Vi tar den linjära regressionsekvationen till matrisform , för "-th" regressor:

Målindikatorernas beroende av regressorer

Låt oss anta att beroendet av målindikatorn Vi tar den linjära regressionsekvationen till matrisform från regressorer"th" observationen kan uttryckas genom en linjär regressionsekvation av formen:

Vi tar den linjära regressionsekvationen till matrisform

var Vi tar den linjära regressionsekvationen till matrisform - "-th" regressorvärde från 1 till ,

Vi tar den linjära regressionsekvationen till matrisform — antal regressorer från 1 till

Vi tar den linjära regressionsekvationen till matrisform — Vinkelkoefficienter, som representerar det belopp med vilket den beräknade målindikatorn kommer att förändras i genomsnitt när regressorn ändras.

Med andra ord, vi är till för alla (utom Vi tar den linjära regressionsekvationen till matrisform ) för regressorn bestämmer vi "vår" koefficient , multiplicera sedan koefficienterna med värdena för regressorerna "th" observation, som ett resultat får vi en viss approximation "-th" målindikator.

Därför måste vi välja sådana koefficienter Vi tar den linjära regressionsekvationen till matrisform , där värdena för vår approximativa funktion kommer att placeras så nära målindikatorvärdena som möjligt.

Bedöma kvaliteten på den approximerande funktionen

Vi kommer att bestämma kvalitetsbedömningen av den approximerande funktionen med hjälp av minsta kvadratmetoden. Funktionen för kvalitetsbedömning i detta fall kommer att ha följande form:

Vi tar den linjära regressionsekvationen till matrisform

Vi måste välja sådana värden av koefficienterna $w$ för vilka värdet Vi tar den linjära regressionsekvationen till matrisform kommer att vara den minsta.

Konvertera ekvationen till matrisform

Vektor representation

Till att börja med, för att göra ditt liv enklare, bör du vara uppmärksam på den linjära regressionsekvationen och lägga märke till att den första koefficienten Vi tar den linjära regressionsekvationen till matrisform multipliceras inte med någon regressor. Samtidigt, när vi omvandlar data till matrisform, kommer ovannämnda omständighet att allvarligt komplicera beräkningarna. I detta avseende föreslås det att införa ytterligare en regressor för den första koefficienten Vi tar den linjära regressionsekvationen till matrisform och likställ det med en. Eller snarare, varje"likställ det:e värdet av denna regressor med ett - trots allt, när det multipliceras med ett, kommer ingenting att förändras ur synvinkeln av resultatet av beräkningarna, men ur synvinkeln av reglerna för produkten av matriser, vår plåga kommer att minska avsevärt.

Nu, för tillfället, för att förenkla materialet, låt oss anta att vi bara har en " Vi tar den linjära regressionsekvationen till matrisform -th" observation. Föreställ dig sedan regressorernas värden "-th" observationer som en vektor . Vektor har dimension Det är, rader och 1 kolumn:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss representera de nödvändiga koefficienterna som en vektor Vi tar den linjära regressionsekvationen till matrisform , med dimension :

Vi tar den linjära regressionsekvationen till matrisform

Linjär regressionsekvation för " Vi tar den linjära regressionsekvationen till matrisform -th" observation kommer att ha formen:

Vi tar den linjära regressionsekvationen till matrisform

Funktionen för att bedöma kvaliteten på en linjär modell kommer att ha formen:

Vi tar den linjära regressionsekvationen till matrisform

Observera att i enlighet med reglerna för matrismultiplikation behövde vi transponera vektorn Vi tar den linjära regressionsekvationen till matrisform .

Matrisrepresentation

Som ett resultat av att multiplicera vektorer får vi talet: Vi tar den linjära regressionsekvationen till matrisform , vilket är att vänta. Detta nummer är uppskattningen "-th" målindikator. Men vi behöver en approximation av inte bara ett målvärde, utan alla. För att göra detta, låt oss skriva ner allt ""th" regressorer i matrisformat . Den resulterande matrisen har dimensionen Vi tar den linjära regressionsekvationen till matrisform :

Vi tar den linjära regressionsekvationen till matrisform

Nu kommer den linjära regressionsekvationen att ta formen:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss beteckna värdena för målindikatorer (alla Vi tar den linjära regressionsekvationen till matrisform ) per vektor dimensionera :

Vi tar den linjära regressionsekvationen till matrisform

Nu kan vi skriva ekvationen för att bedöma kvaliteten på en linjär modell i matrisformat:

Vi tar den linjära regressionsekvationen till matrisform

Faktiskt, från denna formel erhåller vi vidare den formel som vi känner till Vi tar den linjära regressionsekvationen till matrisform

Hur det är gjort? Paranteserna öppnas, differentiering utförs, de resulterande uttrycken transformeras, etc., och det är precis vad vi kommer att göra nu.

Matristransformationer

Låt oss öppna parenteserna

Vi tar den linjära regressionsekvationen till matrisform

Låt oss förbereda en ekvation för differentiering

För att göra detta kommer vi att utföra några transformationer. I efterföljande beräkningar kommer det att vara bekvämare för oss om vektorn Vi tar den linjära regressionsekvationen till matrisform kommer att representeras i början av varje produkt i ekvationen.

Konvertering 1

Vi tar den linjära regressionsekvationen till matrisform

Hur hände det? För att besvara den här frågan, titta bara på storleken på de matriser som multipliceras och se att vid utgången får vi ett tal eller på annat sätt Vi tar den linjära regressionsekvationen till matrisform .

Låt oss skriva ner storlekarna på matrisuttryck.

Vi tar den linjära regressionsekvationen till matrisform

Konvertering 2

Vi tar den linjära regressionsekvationen till matrisform

Låt oss skriva det på ett liknande sätt som transformation 1

Vi tar den linjära regressionsekvationen till matrisform

Vid utgången får vi en ekvation som vi måste differentiera:
Vi tar den linjära regressionsekvationen till matrisform

Vi differentierar modellens kvalitetsbedömningsfunktion

Låt oss skilja på vektorn Vi tar den linjära regressionsekvationen till matrisform :

Vi tar den linjära regressionsekvationen till matrisform

Frågor varför Vi tar den linjära regressionsekvationen till matrisform det borde inte finnas, men vi kommer att undersöka operationerna för att bestämma derivat i de andra två uttrycken mer i detalj.

Differentiering 1

Låt oss expandera på differentieringen: Vi tar den linjära regressionsekvationen till matrisform

För att bestämma derivatan av en matris eller vektor måste du titta på vad som finns inuti dem. Vi kollar:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss beteckna produkten av matriser Vi tar den linjära regressionsekvationen till matrisform genom matrisen . Matris kvadratisk och dessutom är den symmetrisk. Dessa egenskaper kommer att vara användbara för oss senare, låt oss komma ihåg dem. Matris har dimension :

Vi tar den linjära regressionsekvationen till matrisform

Nu är vår uppgift att korrekt multiplicera vektorerna med matrisen och inte få "två gånger två är fem", så låt oss koncentrera oss och vara extremt försiktiga.

Vi tar den linjära regressionsekvationen till matrisform

Men vi har uppnått ett intrikat uttryck! Faktum är att vi fick ett nummer - en skalär. Och nu går vi på riktigt över till differentiering. Det är nödvändigt att hitta derivatan av det resulterande uttrycket för varje koefficient Vi tar den linjära regressionsekvationen till matrisform och få dimensionsvektorn som utdata . För säkerhets skull kommer jag att skriva ner procedurerna genom åtgärd:

1) särskilja med Vi tar den linjära regressionsekvationen till matrisform , vi får:

2) särskilja med Vi tar den linjära regressionsekvationen till matrisform , vi får:

3) särskilja med Vi tar den linjära regressionsekvationen till matrisform , vi får:

Utdata är den utlovade vektorn av storlek Vi tar den linjära regressionsekvationen till matrisform :

Vi tar den linjära regressionsekvationen till matrisform

Om du tittar närmare på vektorn kommer du att märka att de vänstra och motsvarande högra elementen i vektorn kan grupperas på ett sådant sätt att en vektor som ett resultat kan isoleras från den presenterade vektorn Vi tar den linjära regressionsekvationen till matrisform storlek . Till exempel (vänster element i vektorns översta linje) (det högra elementet i vektorns översta linje) kan representeras som Och - som etc. på varje rad. Låt oss gruppera:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss ta ut vektorn Vi tar den linjära regressionsekvationen till matrisform och vid utgången får vi:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss nu titta närmare på den resulterande matrisen. Matrisen är summan av två matriser Vi tar den linjära regressionsekvationen till matrisform :

Vi tar den linjära regressionsekvationen till matrisform

Låt oss komma ihåg att vi lite tidigare noterade en viktig egenskap hos matrisen Vi tar den linjära regressionsekvationen till matrisform - den är symmetrisk. Baserat på denna egenskap kan vi med säkerhet säga att uttrycket lika . Detta kan enkelt verifieras genom att expandera produkten av matriser element för element . Vi kommer inte att göra detta här, de som är intresserade kan kontrollera det själva.

Låt oss återgå till vårt uttryck. Efter våra förvandlingar blev det som vi ville se det:

Vi tar den linjära regressionsekvationen till matrisform

Så vi har slutfört den första differentieringen. Låt oss gå vidare till det andra uttrycket.

Differentiering 2

Vi tar den linjära regressionsekvationen till matrisform

Låt oss följa den upptrampade stigen. Den kommer att vara mycket kortare än den föregående, så gå inte för långt från skärmen.

Låt oss expandera vektorerna och matrisen element för element:

Vi tar den linjära regressionsekvationen till matrisform

Låt oss ta bort de två från beräkningarna ett tag – det spelar ingen stor roll, sedan sätter vi tillbaka det på sin plats. Låt oss multiplicera vektorerna med matrisen. Först och främst, låt oss multiplicera matrisen Vi tar den linjära regressionsekvationen till matrisform till vektor , vi har inga begränsningar här. Vi får storleksvektorn :

Vi tar den linjära regressionsekvationen till matrisform

Låt oss utföra följande åtgärd - multiplicera vektorn Vi tar den linjära regressionsekvationen till matrisform till den resulterande vektorn. Vid utgången väntar numret på oss:

Vi tar den linjära regressionsekvationen till matrisform

Då kommer vi att skilja på det. Vid utgången får vi en dimensionsvektor Vi tar den linjära regressionsekvationen till matrisform :

Vi tar den linjära regressionsekvationen till matrisform

Påminner mig om något? Det är rätt! Detta är produkten av matrisen Vi tar den linjära regressionsekvationen till matrisform till vektor .

Således är den andra differentieringen framgångsrikt slutförd.

I stället för en slutsats

Nu vet vi hur jämställdheten kom till Vi tar den linjära regressionsekvationen till matrisform .

Slutligen kommer vi att beskriva ett snabbt sätt att omvandla grundläggande formler.

Låt oss utvärdera kvaliteten på modellen i enlighet med minsta kvadratmetoden:
Vi tar den linjära regressionsekvationen till matrisform

Vi tar den linjära regressionsekvationen till matrisform

Låt oss skilja det resulterande uttrycket:
Vi tar den linjära regressionsekvationen till matrisform

Vi tar den linjära regressionsekvationen till matrisform

Litteratur

Internetkällor:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Läroböcker, samlingar av problem:

1) Föreläsningsanteckningar om högre matematik: hel kurs / D.T. Skrivet – 4:e uppl. – M.: Iris-press, 2006
2) Tillämpad regressionsanalys / N. Draper, G. Smith - 2nd ed. – M.: Finans och statistik, 1986 (översättning från engelska)
3) Problem för att lösa matrisekvationer:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html

Källa: will.com