Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Účelem článku je poskytnout podporu začínajícím datovým vědcům. V předchozí článek Nastínili jsme tři způsoby řešení lineární regresní rovnice: analytické řešení, sestup gradientu, stochastický sestup gradientu. Poté jsme pro analytické řešení použili vzorec Rovnici lineární regrese převedeme do maticového tvaru. V tomto článku, jak název napovídá, použití tohoto vzorce zdůvodníme, nebo jinými slovy sami odvodíme.

Proč má smysl věnovat vzorci zvýšenou pozornost Rovnici lineární regrese převedeme do maticového tvaru?

Právě s maticovou rovnicí se člověk ve většině případů začíná seznamovat s lineární regresí. Podrobné výpočty, jak byl vzorec odvozen, jsou přitom vzácné.

Například v kurzech strojového učení od Yandex, když jsou studenti seznamováni s regularizací, je jim nabídnuto použití funkcí z knihovny sklearn, přičemž ani slovo není zmíněno o maticové reprezentaci algoritmu. Právě v tuto chvíli mohou někteří posluchači chtít porozumět této problematice podrobněji – psát kód bez použití hotových funkcí. A k tomu musíte nejprve prezentovat rovnici s regularizátorem ve formě matice. Tento článek umožní těm, kteří chtějí takové dovednosti zvládnout. Začněme.

Počáteční podmínky

Cílové ukazatele

Máme řadu cílových hodnot. Cílovým ukazatelem může být například cena jakéhokoli aktiva: ropy, zlata, pšenice, dolaru atd. Zároveň řadou hodnot cílových indikátorů rozumíme počet pozorování. Takovými pozorováními mohou být například měsíční ceny ropy za rok, to znamená, že budeme mít 12 cílových hodnot. Začněme představovat notaci. Každou hodnotu cílového indikátoru označme jako Rovnici lineární regrese převedeme do maticového tvaru. Celkem máme Rovnici lineární regrese převedeme do maticového tvaru pozorování, což znamená, že můžeme svá pozorování reprezentovat jako Rovnici lineární regrese převedeme do maticového tvaru.

Regresoři

Budeme předpokládat, že existují faktory, které do určité míry vysvětlují hodnoty cílového indikátoru. Například směnný kurz dolar/rubl je silně ovlivněn cenou ropy, kurzem Federálního rezervního systému atd. Takové faktory se nazývají regresory. Každá cílová hodnota indikátoru přitom musí odpovídat hodnotě regresoru, to znamená, že pokud máme 12 cílových indikátorů na každý měsíc v roce 2018, pak bychom měli mít za stejné období také 12 hodnot regresoru. Označme hodnoty každého regresoru pomocí Rovnici lineární regrese převedeme do maticového tvaru. Budiž v našem případě Rovnici lineární regrese převedeme do maticového tvaru regresory (tj. Rovnici lineární regrese převedeme do maticového tvaru faktory, které ovlivňují cílové hodnoty indikátoru). To znamená, že naši regresoři mohou být prezentováni takto: pro 1. regresora (například cena ropy): Rovnici lineární regrese převedeme do maticového tvaru, pro 2. regresora (například sazba Fedu): Rovnici lineární regrese převedeme do maticového tvaru, pro "Rovnici lineární regrese převedeme do maticového tvaru-th" regresor: Rovnici lineární regrese převedeme do maticového tvaru

Závislost cílových indikátorů na regresorech

Předpokládejme, že závislost cílového indikátoru Rovnici lineární regrese převedeme do maticového tvaru od regresorů"Rovnici lineární regrese převedeme do maticového tvarupozorování lze vyjádřit lineární regresní rovnicí ve tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Kde Rovnici lineární regrese převedeme do maticového tvaru - "Rovnici lineární regrese převedeme do maticového tvaru-th" hodnota regresoru od 1 do Rovnici lineární regrese převedeme do maticového tvaru,

Rovnici lineární regrese převedeme do maticového tvaru — počet regresorů od 1 do Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru — úhlové koeficienty, které představují hodnotu, o kterou se vypočítaný cílový ukazatel v průměru změní, když se změní regresor.

Jinými slovy, jsme pro všechny (kromě Rovnici lineární regrese převedeme do maticového tvaru) regresoru určíme „náš“ koeficient Rovnici lineární regrese převedeme do maticového tvaru, pak vynásobte koeficienty hodnotami regresorů "Rovnici lineární regrese převedeme do maticového tvaru"pozorování, v důsledku toho získáme určitou aproximaci"Rovnici lineární regrese převedeme do maticového tvaru-th" cílový ukazatel.

Proto musíme takové koeficienty vybrat Rovnici lineární regrese převedeme do maticového tvaru, při které jsou hodnoty naší aproximační funkce Rovnici lineární regrese převedeme do maticového tvaru budou umístěny co nejblíže cílovým hodnotám indikátoru.

Posouzení kvality aproximační funkce

Kvalitní posouzení aproximační funkce určíme metodou nejmenších čtverců. Funkce hodnocení kvality bude mít v tomto případě následující podobu:

Rovnici lineární regrese převedeme do maticového tvaru

Musíme vybrat takové hodnoty koeficientů $w$, pro které je hodnota Rovnici lineární regrese převedeme do maticového tvaru bude nejmenší.

Převod rovnice do maticového tvaru

Vektorové znázornění

Pro začátek, abyste si usnadnili život, měli byste věnovat pozornost lineární regresní rovnici a všimnout si, že první koeficient Rovnici lineární regrese převedeme do maticového tvaru není násobeno žádným regresorem. Přitom, když data převedeme do maticové podoby, výše zmíněná okolnost výpočty vážně zkomplikuje. V tomto ohledu se navrhuje zavést další regresor pro první koeficient Rovnici lineární regrese převedeme do maticového tvaru a přirovnat to k jedné. Nebo spíše každý "Rovnici lineární regrese převedeme do maticového tvarupřirovnat th hodnotu tohoto regresoru k jedničce - vždyť při vynásobení jednou se z hlediska výsledku výpočtů nic nezmění, ale z hlediska pravidel pro součin matic se naše muka se výrazně sníží.

Nyní, pro zjednodušení materiálu, předpokládejme, že máme pouze jeden "Rovnici lineární regrese převedeme do maticového tvaru-té" pozorování. Pak si představte hodnoty regresorů“Rovnici lineární regrese převedeme do maticového tvaru-th" pozorování jako vektor Rovnici lineární regrese převedeme do maticového tvaru. Vektor Rovnici lineární regrese převedeme do maticového tvaru má rozměr Rovnici lineární regrese převedeme do maticového tvaruTo znamená, že Rovnici lineární regrese převedeme do maticového tvaru řádky a 1 sloupec:

Rovnici lineární regrese převedeme do maticového tvaru

Reprezentujme požadované koeficienty jako vektor Rovnici lineární regrese převedeme do maticového tvaru, mající rozměr Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Rovnice lineární regrese pro "Rovnici lineární regrese převedeme do maticového tvaru-th" pozorování bude mít podobu:

Rovnici lineární regrese převedeme do maticového tvaru

Funkce pro hodnocení kvality lineárního modelu bude mít podobu:

Rovnici lineární regrese převedeme do maticového tvaru

Upozorňujeme, že v souladu s pravidly násobení matic jsme potřebovali vektor transponovat Rovnici lineární regrese převedeme do maticového tvaru.

Maticová reprezentace

V důsledku násobení vektorů dostaneme číslo: Rovnici lineární regrese převedeme do maticového tvaru, což se dá očekávat. Toto číslo je přibližné"Rovnici lineární regrese převedeme do maticového tvaru-th" cílový ukazatel. Potřebujeme však aproximaci nejen jedné cílové hodnoty, ale všech. Chcete-li to provést, zapišme si vše "Rovnici lineární regrese převedeme do maticového tvaru"té" regresory v maticovém formátu Rovnici lineární regrese převedeme do maticového tvaru. Výsledná matice má rozměr Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Nyní bude mít rovnice lineární regrese tvar:

Rovnici lineární regrese převedeme do maticového tvaru

Označme hodnoty cílových ukazatelů (všechny Rovnici lineární regrese převedeme do maticového tvaru) na vektor Rovnici lineární regrese převedeme do maticového tvaru dimenze Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Nyní můžeme napsat rovnici pro posouzení kvality lineárního modelu v maticovém formátu:

Rovnici lineární regrese převedeme do maticového tvaru

Ve skutečnosti z tohoto vzorce dále získáme vzorec nám známý Rovnici lineární regrese převedeme do maticového tvaru

Jak se to dělá? Otevřou se závorky, provede se diferenciace, transformují se výsledné výrazy atd., a to je přesně to, co teď uděláme.

Maticové transformace

Otevřeme závorky

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Připravme si rovnici pro derivování

Za tímto účelem provedeme některé transformace. V dalších výpočtech pro nás bude výhodnější, když vektor Rovnici lineární regrese převedeme do maticového tvaru bude reprezentován na začátku každého produktu v rovnici.

Konverze 1

Rovnici lineární regrese převedeme do maticového tvaru

Jak se to stalo? Chcete-li odpovědět na tuto otázku, podívejte se na velikosti násobených matic a uvidíte, že na výstupu dostaneme číslo nebo jinak Rovnici lineární regrese převedeme do maticového tvaru.

Zapišme si velikosti maticových výrazů.

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Konverze 2

Rovnici lineární regrese převedeme do maticového tvaru

Zapišme to podobně jako transformaci 1

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Na výstupu dostaneme rovnici, kterou musíme diferencovat:
Rovnici lineární regrese převedeme do maticového tvaru

Rozlišujeme funkci hodnocení kvality modelu

Rozlišujme s ohledem na vektor Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Otázky proč Rovnici lineární regrese převedeme do maticového tvaru by nemělo být, ale operace pro určování derivací v dalších dvou výrazech prozkoumáme podrobněji.

Diferenciace 1

Rozšiřme diferenciaci: Rovnici lineární regrese převedeme do maticového tvaru

Abyste mohli určit derivaci matice nebo vektoru, musíte se podívat na to, co je uvnitř nich. Podívejme se:

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru Rovnici lineární regrese převedeme do maticového tvaru

Označme součin matic Rovnici lineární regrese převedeme do maticového tvaru přes matrici Rovnici lineární regrese převedeme do maticového tvaru. Matice Rovnici lineární regrese převedeme do maticového tvaru čtvercový a navíc symetrický. Tyto vlastnosti se nám budou hodit později, připomeňme si je. Matice Rovnici lineární regrese převedeme do maticového tvaru má rozměr Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Nyní je naším úkolem správně vynásobit vektory maticí a nedostat „dvakrát dva je pět“, takže se soustřeďme a buďme extrémně opatrní.

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Dosáhli jsme však složitého výrazu! Ve skutečnosti jsme dostali číslo - skalár. A nyní popravdě přejdeme k diferenciaci. Pro každý koeficient je nutné najít derivaci výsledného výrazu Rovnici lineární regrese převedeme do maticového tvaru a získat kótovací vektor jako výstup Rovnici lineární regrese převedeme do maticového tvaru. Pro každý případ sepíšu postupy podle akce:

1) rozlišovat podle Rovnici lineární regrese převedeme do maticového tvaru, dostaneme: Rovnici lineární regrese převedeme do maticového tvaru

2) rozlišovat podle Rovnici lineární regrese převedeme do maticového tvaru, dostaneme: Rovnici lineární regrese převedeme do maticového tvaru

3) rozlišovat podle Rovnici lineární regrese převedeme do maticového tvaru, dostaneme: Rovnici lineární regrese převedeme do maticového tvaru

Výstupem je slíbený vektor velikosti Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Pokud se na vektor podíváte blíže, všimnete si, že levý a odpovídající pravý prvek vektoru lze seskupit tak, že v důsledku toho lze vektor izolovat z prezentovaného vektoru. Rovnici lineární regrese převedeme do maticového tvaru размера Rovnici lineární regrese převedeme do maticového tvaru. Například, Rovnici lineární regrese převedeme do maticového tvaru (levý prvek horního řádku vektoru) Rovnici lineární regrese převedeme do maticového tvaru (pravý prvek horního řádku vektoru) může být reprezentován jako Rovnici lineární regrese převedeme do maticového tvarua Rovnici lineární regrese převedeme do maticového tvaru - tak jako Rovnici lineární regrese převedeme do maticového tvaru atd. na každém řádku. Pojďme seskupit:

Rovnici lineární regrese převedeme do maticového tvaru

Vyjmeme vektor Rovnici lineární regrese převedeme do maticového tvaru a na výstupu dostaneme:

Rovnici lineární regrese převedeme do maticového tvaru

Nyní se podívejme blíže na výslednou matici. Matice je součtem dvou matic Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Připomeňme, že o něco dříve jsme zaznamenali jednu důležitou vlastnost matice Rovnici lineární regrese převedeme do maticového tvaru - je symetrický. Na základě této vlastnosti můžeme s jistotou říci, že výraz Rovnici lineární regrese převedeme do maticového tvaru rovná se Rovnici lineární regrese převedeme do maticového tvaru. To lze snadno ověřit rozšiřováním součinu matic prvek po prvku Rovnici lineární regrese převedeme do maticového tvaru. Tady to dělat nebudeme, zájemci si to mohou ověřit sami.

Vraťme se k našemu vyjádření. Po našich proměnách to dopadlo tak, jak jsme to chtěli vidět:

Rovnici lineární regrese převedeme do maticového tvaru

Takže máme hotovou první diferenciaci. Přejděme k druhému výrazu.

Diferenciace 2

Rovnici lineární regrese převedeme do maticového tvaru

Jdeme po vyšlapané cestě. Bude mnohem kratší než předchozí, takže se příliš nevzdalujte od obrazovky.

Rozbalme vektory a matici prvek po prvku:

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Na chvíli odstraníme dvojku z výpočtů – nehraje velkou roli, pak ji vrátíme na své místo. Vynásobme vektory maticí. Nejprve si vynásobme matici Rovnici lineární regrese převedeme do maticového tvaru do vektoru Rovnici lineární regrese převedeme do maticového tvaru, zde nemáme žádná omezení. Dostaneme vektor velikosti Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Proveďme následující akci - vynásobte vektor Rovnici lineární regrese převedeme do maticového tvaru k výslednému vektoru. U východu na nás bude čekat číslo:

Rovnici lineární regrese převedeme do maticového tvaru

Pak to rozlišíme. Na výstupu dostaneme vektor dimenze Rovnici lineární regrese převedeme do maticového tvaru:

Rovnici lineární regrese převedeme do maticového tvaru

Připomíná mi to něco? To je správně! Toto je produkt matice Rovnici lineární regrese převedeme do maticového tvaru do vektoru Rovnici lineární regrese převedeme do maticového tvaru.

Tím je druhá diferenciace úspěšně dokončena.

Místo závěru

Nyní víme, jak k rovnosti došlo Rovnici lineární regrese převedeme do maticového tvaru.

Nakonec si popíšeme rychlý způsob transformace základních vzorců.

Zhodnoťme kvalitu modelu v souladu s metodou nejmenších čtverců:
Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Rozlišujme výsledný výraz:
Rovnici lineární regrese převedeme do maticového tvaru Rovnici lineární regrese převedeme do maticového tvaru

Rovnici lineární regrese převedeme do maticového tvaru

Literatura

Internetové zdroje:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Učebnice, sbírky úloh:

1) Poznámky z přednášky z vyšší matematiky: celý kurz / D.T. Napsáno – 4. vyd. – M.: Iris-press, 2006
2) Aplikovaná regresní analýza / N. Draper, G. Smith - 2. vyd. – M.: Finance and Statistics, 1986 (překlad z angličtiny)
3) Úlohy pro řešení maticových rovnic:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Zdroj: www.habr.com

Přidat komentář