Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Účelom článku je poskytnúť podporu začínajúcim dátovým vedcom. IN predchádzajúci článok Načrtli sme tri spôsoby riešenia lineárnej regresnej rovnice: analytické riešenie, gradientový zostup, stochastický gradientový zostup. Potom sme na analytické riešenie použili vzorec Prevedieme rovnicu lineárnej regresie do maticového tvaru. V tomto článku, ako už názov napovedá, odôvodníme použitie tohto vzorca, alebo inak povedané, sami si ho odvodíme.

Prečo má zmysel venovať vzorcu zvýšenú pozornosť Prevedieme rovnicu lineárnej regresie do maticového tvaru?

Práve s maticovou rovnicou sa vo väčšine prípadov človek začína oboznamovať s lineárnou regresiou. Zároveň sú zriedkavé podrobné výpočty, ako bol vzorec odvodený.

Napríklad v kurzoch strojového učenia od spoločnosti Yandex, keď sú študenti oboznámení s regularizáciou, je im ponúknuté používať funkcie z knižnice sklearn, pričom sa ani slovo nespomína o maticovej reprezentácii algoritmu. Práve v tejto chvíli môžu niektorí poslucháči chcieť porozumieť tejto problematike podrobnejšie – písať kód bez použitia hotových funkcií. Aby ste to dosiahli, musíte najprv prezentovať rovnicu s regularizátorom v maticovej forme. Tento článok umožní tým, ktorí chcú zvládnuť takéto zručnosti. Začnime.

Počiatočné podmienky

Cieľové ukazovatele

Máme rozsah cieľových hodnôt. Cieľovým ukazovateľom môže byť napríklad cena akéhokoľvek aktíva: ropy, zlata, pšenice, dolára atď. Zároveň množstvom cieľových hodnôt ukazovateľa rozumieme počet pozorovaní. Takými pozorovaniami môžu byť napríklad mesačné ceny ropy za rok, to znamená, že budeme mať 12 cieľových hodnôt. Začnime predstavovať notáciu. Každú hodnotu cieľového ukazovateľa označme ako Prevedieme rovnicu lineárnej regresie do maticového tvaru. Celkovo máme Prevedieme rovnicu lineárnej regresie do maticového tvaru pozorovania, čo znamená, že svoje pozorovania môžeme reprezentovať ako Prevedieme rovnicu lineárnej regresie do maticového tvaru.

Regresory

Budeme predpokladať, že existujú faktory, ktoré do určitej miery vysvetľujú hodnoty cieľového ukazovateľa. Napríklad výmenný kurz dolár/rubeľ je silne ovplyvnený cenou ropy, kurzom Federálneho rezervného systému atď. Takéto faktory sa nazývajú regresory. Zároveň každá cieľová hodnota ukazovateľa musí zodpovedať hodnote regresora, to znamená, že ak máme 12 cieľových ukazovateľov na každý mesiac v roku 2018, mali by sme mať za rovnaké obdobie aj 12 regresorových hodnôt. Označme hodnoty každého regresora pomocou Prevedieme rovnicu lineárnej regresie do maticového tvaru. Nech je to v našom prípade Prevedieme rovnicu lineárnej regresie do maticového tvaru regresory (t.j. Prevedieme rovnicu lineárnej regresie do maticového tvaru faktory, ktoré ovplyvňujú cieľové hodnoty ukazovateľa). To znamená, že naše regresory môžu byť prezentované nasledovne: pre 1. regresora (napríklad cena ropy): Prevedieme rovnicu lineárnej regresie do maticového tvaru, pre 2. regresora (napríklad kurz Fedu): Prevedieme rovnicu lineárnej regresie do maticového tvaru, Pre "Prevedieme rovnicu lineárnej regresie do maticového tvaru-th" regresor: Prevedieme rovnicu lineárnej regresie do maticového tvaru

Závislosť cieľových ukazovateľov od regresorov

Predpokladajme, že závislosť cieľového ukazovateľa Prevedieme rovnicu lineárnej regresie do maticového tvaru od regresorov"Prevedieme rovnicu lineárnej regresie do maticového tvarupozorovanie možno vyjadriť lineárnou regresnou rovnicou v tvare:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Kde Prevedieme rovnicu lineárnej regresie do maticového tvaru - "Prevedieme rovnicu lineárnej regresie do maticového tvaru-th" hodnota regresora od 1 do Prevedieme rovnicu lineárnej regresie do maticového tvaru,

Prevedieme rovnicu lineárnej regresie do maticového tvaru — počet regresorov od 1 do Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru — uhlové koeficienty, ktoré predstavujú hodnotu, o ktorú sa vypočítaný cieľový ukazovateľ v priemere zmení pri zmene regresora.

Inými slovami, sme pre každého (okrem Prevedieme rovnicu lineárnej regresie do maticového tvaru) regresora určíme „náš“ koeficient Prevedieme rovnicu lineárnej regresie do maticového tvaru, potom vynásobte koeficienty hodnotami regresorov "Prevedieme rovnicu lineárnej regresie do maticového tvaru"pozorovania, výsledkom je určitá aproximácia"Prevedieme rovnicu lineárnej regresie do maticového tvaru-tý“ cieľový ukazovateľ.

Preto musíme zvoliť také koeficienty Prevedieme rovnicu lineárnej regresie do maticového tvaru, pri ktorej sú hodnoty našej aproximačnej funkcie Prevedieme rovnicu lineárnej regresie do maticového tvaru budú umiestnené čo najbližšie k cieľovým hodnotám indikátora.

Posúdenie kvality aproximačnej funkcie

Kvalitné posúdenie aproximačnej funkcie určíme metódou najmenších štvorcov. Funkcia hodnotenia kvality bude mať v tomto prípade nasledujúcu formu:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Musíme vybrať také hodnoty koeficientov $w$, pre ktoré je hodnota Prevedieme rovnicu lineárnej regresie do maticového tvaru bude najmenší.

Prevod rovnice do maticového tvaru

Vektorové znázornenie

Na začiatok, aby ste si uľahčili život, mali by ste venovať pozornosť lineárnej regresnej rovnici a všimnúť si, že prvý koeficient Prevedieme rovnicu lineárnej regresie do maticového tvaru nie je násobený žiadnym regresorom. Zároveň, keď údaje prevedieme do maticovej podoby, vyššie uvedená okolnosť poriadne skomplikuje výpočty. V tejto súvislosti sa navrhuje zaviesť ďalší regresor pre prvý koeficient Prevedieme rovnicu lineárnej regresie do maticového tvaru a prirovnať to k jednej. Alebo skôr každý "Prevedieme rovnicu lineárnej regresie do maticového tvaruprirovnať th hodnotu tohto regresora k jednej - veď pri vynásobení jednou sa z pohľadu výsledku výpočtov nič nezmení, ale z pohľadu pravidiel pre súčin matíc sa naše trápenie sa výrazne zníži.

Teraz, pre zjednodušenie materiálu, predpokladajme, že máme len jeden "Prevedieme rovnicu lineárnej regresie do maticového tvaru-té" pozorovanie. Potom si predstavte hodnoty regresorov“Prevedieme rovnicu lineárnej regresie do maticového tvaru-th" pozorovania ako vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru. Vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru má rozmer Prevedieme rovnicu lineárnej regresie do maticového tvaruTo znamená, že Prevedieme rovnicu lineárnej regresie do maticového tvaru riadky a 1 stĺpec:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Reprezentujme požadované koeficienty ako vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru, ktorý má rozmer Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Rovnica lineárnej regresie pre "Prevedieme rovnicu lineárnej regresie do maticového tvaru-th" pozorovanie bude mať formu:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Funkcia na hodnotenie kvality lineárneho modelu bude mať podobu:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Upozorňujeme, že v súlade s pravidlami násobenia matíc sme potrebovali transponovať vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru.

Maticová reprezentácia

V dôsledku vynásobenia vektorov dostaneme číslo: Prevedieme rovnicu lineárnej regresie do maticového tvaru, čo sa dá očakávať. Toto číslo je približné "Prevedieme rovnicu lineárnej regresie do maticového tvaru-tý“ cieľový ukazovateľ. Potrebujeme však aproximáciu nielen jednej cieľovej hodnoty, ale všetkých. Ak to chcete urobiť, zapíšme si všetko "Prevedieme rovnicu lineárnej regresie do maticového tvaru-th" regresory v maticovom formáte Prevedieme rovnicu lineárnej regresie do maticového tvaru. Výsledná matica má rozmer Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Teraz bude mať rovnica lineárnej regresie tvar:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Označme hodnoty cieľových ukazovateľov (všetky Prevedieme rovnicu lineárnej regresie do maticového tvaru) na vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru rozmer Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Teraz môžeme napísať rovnicu na hodnotenie kvality lineárneho modelu v maticovom formáte:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

V skutočnosti z tohto vzorca ďalej získame vzorec, ktorý je nám známy Prevedieme rovnicu lineárnej regresie do maticového tvaru

Ako sa to robí? Otvoria sa zátvorky, vykoná sa diferenciácia, transformujú sa výsledné výrazy atď., a to je presne to, čo teraz urobíme.

Maticové transformácie

Otvoríme zátvorky

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Pripravme si rovnicu na diferenciáciu

Aby sme to dosiahli, vykonáme niekoľko transformácií. Pri následných výpočtoch bude pre nás výhodnejšie, ak vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru budú zastúpené na začiatku každého produktu v rovnici.

Konverzia 1

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Ako sa to stalo? Ak chcete odpovedať na túto otázku, stačí sa pozrieť na veľkosti matíc, ktoré sa násobia, a uvidíte, že na výstupe dostaneme číslo alebo inak Prevedieme rovnicu lineárnej regresie do maticového tvaru.

Zapíšme si veľkosti maticových výrazov.

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Konverzia 2

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Napíšme to podobne ako transformáciu 1

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Na výstupe dostaneme rovnicu, ktorú musíme diferencovať:
Prevedieme rovnicu lineárnej regresie do maticového tvaru

Rozlišujeme funkciu hodnotenia kvality modelu

Rozlišujme vzhľadom na vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Otázky prečo Prevedieme rovnicu lineárnej regresie do maticového tvaru by nemalo byť, ale operácie na určovanie derivácií v ďalších dvoch výrazoch preskúmame podrobnejšie.

Diferenciácia 1

Rozšírime diferenciáciu: Prevedieme rovnicu lineárnej regresie do maticového tvaru

Aby ste mohli určiť deriváciu matice alebo vektora, musíte sa pozrieť na to, čo je v nich. Pozri:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru Prevedieme rovnicu lineárnej regresie do maticového tvaru

Označme súčin matíc Prevedieme rovnicu lineárnej regresie do maticového tvaru cez matricu Prevedieme rovnicu lineárnej regresie do maticového tvaru. Matrix Prevedieme rovnicu lineárnej regresie do maticového tvaru štvorcový a navyše je symetrický. Tieto vlastnosti sa nám budú hodiť neskôr, zapamätajme si ich. Matrix Prevedieme rovnicu lineárnej regresie do maticového tvaru má rozmer Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Teraz je našou úlohou správne vynásobiť vektory maticou a nedostať „dvakrát dva je päť“, takže sa sústreďme a buďme mimoriadne opatrní.

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Dosiahli sme však zložitý výraz! V skutočnosti sme dostali číslo - skalár. A teraz skutočne prejdime k diferenciácii. Pre každý koeficient je potrebné nájsť deriváciu výsledného výrazu Prevedieme rovnicu lineárnej regresie do maticového tvaru a získajte rozmerový vektor ako výstup Prevedieme rovnicu lineárnej regresie do maticového tvaru. Pre každý prípad napíšem postupy podľa akcie:

1) rozlišovať podľa Prevedieme rovnicu lineárnej regresie do maticového tvaru, dostaneme: Prevedieme rovnicu lineárnej regresie do maticového tvaru

2) rozlišovať podľa Prevedieme rovnicu lineárnej regresie do maticového tvaru, dostaneme: Prevedieme rovnicu lineárnej regresie do maticového tvaru

3) rozlišovať podľa Prevedieme rovnicu lineárnej regresie do maticového tvaru, dostaneme: Prevedieme rovnicu lineárnej regresie do maticového tvaru

Výstupom je sľúbený vektor veľkosti Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Ak sa pozriete na vektor bližšie, všimnete si, že ľavé a zodpovedajúce pravé prvky vektora môžu byť zoskupené takým spôsobom, že v dôsledku toho môže byť vektor izolovaný od prezentovaného vektora. Prevedieme rovnicu lineárnej regresie do maticového tvaru veľkosť Prevedieme rovnicu lineárnej regresie do maticového tvaru, Napríklad Prevedieme rovnicu lineárnej regresie do maticového tvaru (ľavý prvok horného riadku vektora) Prevedieme rovnicu lineárnej regresie do maticového tvaru (pravý prvok horného riadku vektora) môže byť reprezentovaný ako Prevedieme rovnicu lineárnej regresie do maticového tvaruA Prevedieme rovnicu lineárnej regresie do maticového tvaru - ako Prevedieme rovnicu lineárnej regresie do maticového tvaru atď. na každom riadku. Poďme do skupiny:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Vyberieme vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru a na výstupe dostaneme:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Teraz sa pozrime bližšie na výslednú maticu. Matica je súčtom dvoch matíc Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Pripomeňme, že o niečo skôr sme si všimli jednu dôležitú vlastnosť matice Prevedieme rovnicu lineárnej regresie do maticového tvaru - je symetrický. Na základe tejto vlastnosti môžeme s istotou povedať, že výraz Prevedieme rovnicu lineárnej regresie do maticového tvaru rovná Prevedieme rovnicu lineárnej regresie do maticového tvaru. To sa dá ľahko overiť rozšírením súčinu matíc prvok po prvku Prevedieme rovnicu lineárnej regresie do maticového tvaru. Tu to robiť nebudeme, záujemcovia si to môžu overiť sami.

Vráťme sa k nášmu vyjadreniu. Po našich premenách to dopadlo tak, ako sme to chceli vidieť:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prvú diferenciáciu máme teda za sebou. Prejdime k druhému výrazu.

Diferenciácia 2

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Poďme po vyšliapanej ceste. Bude oveľa kratší ako predchádzajúci, takže sa od obrazovky príliš nevzďaľujte.

Rozviňme vektory a maticový prvok po prvku:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Na chvíľu vyškrtneme dvojku z výpočtov – nehrá veľkú rolu, potom ju vrátime na svoje miesto. Vynásobme vektory maticou. Najprv si vynásobme maticu Prevedieme rovnicu lineárnej regresie do maticového tvaru na vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru, tu nemáme žiadne obmedzenia. Dostaneme vektor veľkosti Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Vykonajte nasledujúcu akciu - vynásobte vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru k výslednému vektoru. Pri východe nás bude čakať číslo:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Potom to rozlíšime. Na výstupe dostaneme vektor dimenzie Prevedieme rovnicu lineárnej regresie do maticového tvaru:

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Pripomína mi niečo? To je správne! Toto je produkt matrice Prevedieme rovnicu lineárnej regresie do maticového tvaru na vektor Prevedieme rovnicu lineárnej regresie do maticového tvaru.

Tým je druhá diferenciácia úspešne dokončená.

namiesto záveru

Teraz vieme, ako k rovnosti došlo Prevedieme rovnicu lineárnej regresie do maticového tvaru.

Nakoniec si popíšeme rýchly spôsob transformácie základných vzorcov.

Vyhodnoťme kvalitu modelu v súlade s metódou najmenších štvorcov:
Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Rozlišujme výsledný výraz:
Prevedieme rovnicu lineárnej regresie do maticového tvaru Prevedieme rovnicu lineárnej regresie do maticového tvaru

Prevedieme rovnicu lineárnej regresie do maticového tvaru

Literatúra

Internetové zdroje:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Učebnice, zbierky úloh:

1) Poznámky z prednášky z vyššej matematiky: celý kurz / D.T. Napísané – 4. vyd. – M.: Iris-press, 2006
2) Aplikovaná regresná analýza / N. Draper, G. Smith - 2. vyd. – M.: Finance and Statistics, 1986 (preklad z angličtiny)
3) Úlohy na riešenie maticových rovníc:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Zdroj: hab.com

Pridať komentár