Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Der Zweck des Artikels besteht darin, angehende Datenwissenschaftler zu unterstützen. IN vorheriger Artikel Wir haben drei Möglichkeiten zur Lösung einer linearen Regressionsgleichung beschrieben: analytische Lösung, Gradientenabstieg, stochastischer Gradientenabstieg. Dann haben wir für die analytische Lösung die Formel angewendet Wir bringen die lineare Regressionsgleichung in Matrixform. In diesem Artikel werden wir, wie der Titel schon sagt, die Verwendung dieser Formel begründen oder, mit anderen Worten, sie selbst ableiten.

Warum es sinnvoll ist, der Formel besondere Aufmerksamkeit zu schenken Wir bringen die lineare Regressionsgleichung in Matrixform?

Mit der Matrixgleichung beginnt man in den meisten Fällen, sich mit der linearen Regression vertraut zu machen. Gleichzeitig sind detaillierte Berechnungen zur Herleitung der Formel selten.

In Kursen zum maschinellen Lernen von Yandex wird den Studierenden beispielsweise bei der Einführung in die Regularisierung angeboten, Funktionen aus der Bibliothek zu nutzen sklearn, während kein Wort über die Matrixdarstellung des Algorithmus erwähnt wird. An diesem Punkt möchten einige Zuhörer dieses Problem möglicherweise genauer verstehen – Code schreiben, ohne vorgefertigte Funktionen zu verwenden. Und dazu müssen Sie die Gleichung zunächst mit einem Regularisierer in Matrixform darstellen. Dieser Artikel ermöglicht es denjenigen, die solche Fähigkeiten erlernen möchten. Lass uns anfangen.

Anfangsbedingungen

Zielindikatoren

Wir haben eine Reihe von Zielwerten. Der Zielindikator könnte beispielsweise der Preis eines beliebigen Vermögenswerts sein: Öl, Gold, Weizen, Dollar usw. Unter einer Anzahl von Zielindikatorwerten verstehen wir gleichzeitig die Anzahl der Beobachtungen. Solche Beobachtungen könnten beispielsweise monatliche Ölpreise für das Jahr sein, das heißt, wir haben 12 Zielwerte. Beginnen wir mit der Einführung der Notation. Bezeichnen wir jeden Wert des Zielindikators als Wir bringen die lineare Regressionsgleichung in Matrixform. Insgesamt haben wir Wir bringen die lineare Regressionsgleichung in Matrixform Beobachtungen, was bedeutet, dass wir unsere Beobachtungen als darstellen können Wir bringen die lineare Regressionsgleichung in Matrixform.

Regressoren

Wir gehen davon aus, dass es Faktoren gibt, die die Werte des Zielindikators bis zu einem gewissen Grad erklären. Beispielsweise wird der Wechselkurs Dollar/Rubel stark vom Ölpreis, dem Wechselkurs der Federal Reserve usw. beeinflusst. Solche Faktoren werden als Regressoren bezeichnet. Gleichzeitig muss jeder Zielindikatorwert einem Regressorwert entsprechen, d. h. wenn wir 12 Zielindikatoren für jeden Monat im Jahr 2018 haben, dann sollten wir auch 12 Regressorwerte für denselben Zeitraum haben. Bezeichnen wir die Werte jedes Regressors mit Wir bringen die lineare Regressionsgleichung in Matrixform. In unserem Fall sei es so Wir bringen die lineare Regressionsgleichung in Matrixform Regressoren (d. h. Wir bringen die lineare Regressionsgleichung in Matrixform Faktoren, die die Zielindikatorwerte beeinflussen). Das heißt, unsere Regressoren können wie folgt dargestellt werden: Für den 1. Regressor (zum Beispiel der Ölpreis): Wir bringen die lineare Regressionsgleichung in Matrixform, für den 2. Regressor (z. B. den Fed-Zinssatz): Wir bringen die lineare Regressionsgleichung in Matrixform, zum "Wir bringen die lineare Regressionsgleichung in Matrixform-ter" Regressor: Wir bringen die lineare Regressionsgleichung in Matrixform

Abhängigkeit der Zielindikatoren von Regressoren

Nehmen wir an, dass die Abhängigkeit vom Zielindikator ist Wir bringen die lineare Regressionsgleichung in Matrixform von Regressoren“Wir bringen die lineare Regressionsgleichung in MatrixformDiese Beobachtung kann durch eine lineare Regressionsgleichung der Form ausgedrückt werden:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wo Wir bringen die lineare Regressionsgleichung in Matrixform - "Wir bringen die lineare Regressionsgleichung in Matrixform-th" Regressorwert von 1 bis Wir bringen die lineare Regressionsgleichung in Matrixform,

Wir bringen die lineare Regressionsgleichung in Matrixform — Anzahl der Regressoren von 1 bis Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform — Winkelkoeffizienten, die den Betrag darstellen, um den sich der berechnete Zielindikator im Durchschnitt ändert, wenn sich der Regressor ändert.

Mit anderen Worten: Wir sind für alle da (außer Wir bringen die lineare Regressionsgleichung in Matrixform) des Regressors bestimmen wir „unseren“ Koeffizienten Wir bringen die lineare Regressionsgleichung in Matrixform, dann multiplizieren Sie die Koeffizienten mit den Werten der Regressoren "Wir bringen die lineare Regressionsgleichung in Matrixformth „Beobachtung, als Ergebnis erhalten wir eine gewisse Näherung“Wir bringen die lineare Regressionsgleichung in Matrixform-th"-Zielindikator.

Daher müssen wir solche Koeffizienten auswählen Wir bringen die lineare Regressionsgleichung in Matrixform, bei dem die Werte unserer Näherungsfunktion Wir bringen die lineare Regressionsgleichung in Matrixform möglichst nahe an den Zielindikatorwerten liegen.

Beurteilung der Qualität der Näherungsfunktion

Die Qualitätsbewertung der Näherungsfunktion ermitteln wir mit der Methode der kleinsten Quadrate. Die Qualitätsbewertungsfunktion sieht in diesem Fall wie folgt aus:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir müssen solche Werte der Koeffizienten $w$ auswählen, für die der Wert gilt Wir bringen die lineare Regressionsgleichung in Matrixform wird das Kleinste sein.

Konvertieren der Gleichung in Matrixform

Vektordarstellung

Um Ihnen das Leben zu erleichtern, sollten Sie zunächst auf die lineare Regressionsgleichung achten und den ersten Koeffizienten beachten Wir bringen die lineare Regressionsgleichung in Matrixform wird mit keinem Regressor multipliziert. Gleichzeitig wird der oben genannte Umstand bei der Konvertierung der Daten in Matrixform die Berechnungen erheblich erschweren. In diesem Zusammenhang wird vorgeschlagen, einen weiteren Regressor für den ersten Koeffizienten einzuführen Wir bringen die lineare Regressionsgleichung in Matrixform und setze es mit eins gleich. Oder besser gesagt, jeder "Wir bringen die lineare Regressionsgleichung in MatrixformSetzen Sie den th-Wert dieses Regressors mit eins gleich – schließlich ändert sich bei der Multiplikation mit eins nichts vom Standpunkt des Ergebnisses der Berechnungen, sondern vom Standpunkt der Regeln für das Produkt von Matrizen, unserer Qual wird deutlich reduziert.

Um das Material zu vereinfachen, gehen wir zunächst einmal davon aus, dass wir nur eine haben.Wir bringen die lineare Regressionsgleichung in Matrixform-te" Beobachtung. Stellen Sie sich dann die Werte der Regressoren vor.Wir bringen die lineare Regressionsgleichung in Matrixform-th"-Beobachtungen als Vektor Wir bringen die lineare Regressionsgleichung in Matrixform. Vektor Wir bringen die lineare Regressionsgleichung in Matrixform hat Dimension Wir bringen die lineare Regressionsgleichung in MatrixformDas heißt, Wir bringen die lineare Regressionsgleichung in Matrixform Zeilen und 1 Spalte:

Wir bringen die lineare Regressionsgleichung in Matrixform

Stellen wir die erforderlichen Koeffizienten als Vektor dar Wir bringen die lineare Regressionsgleichung in Matrixform, mit Dimension Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Lineare Regressionsgleichung für „Wir bringen die lineare Regressionsgleichung in Matrixform-te" Beobachtung wird die Form annehmen:

Wir bringen die lineare Regressionsgleichung in Matrixform

Die Funktion zur Beurteilung der Qualität eines linearen Modells hat die Form:

Wir bringen die lineare Regressionsgleichung in Matrixform

Bitte beachten Sie, dass wir gemäß den Regeln der Matrixmultiplikation den Vektor transponieren mussten Wir bringen die lineare Regressionsgleichung in Matrixform.

Matrixdarstellung

Als Ergebnis der Multiplikation von Vektoren erhalten wir die Zahl: Wir bringen die lineare Regressionsgleichung in Matrixform, was zu erwarten ist. Diese Zahl ist die Näherung „Wir bringen die lineare Regressionsgleichung in Matrixform-th"-Zielindikator. Aber wir brauchen eine Annäherung nicht nur an einen Zielwert, sondern an alle. Schreiben wir dazu alles auf.“Wir bringen die lineare Regressionsgleichung in Matrixform„th“-Regressoren im Matrixformat Wir bringen die lineare Regressionsgleichung in Matrixform. Die resultierende Matrix hat die Dimension Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Nun hat die lineare Regressionsgleichung die Form:

Wir bringen die lineare Regressionsgleichung in Matrixform

Bezeichnen wir die Werte der Zielindikatoren (alle Wir bringen die lineare Regressionsgleichung in Matrixform) pro Vektor Wir bringen die lineare Regressionsgleichung in Matrixform Abmessungen Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Jetzt können wir die Gleichung zur Beurteilung der Qualität eines linearen Modells im Matrixformat schreiben:

Wir bringen die lineare Regressionsgleichung in Matrixform

Tatsächlich erhalten wir aus dieser Formel weiterhin die uns bekannte Formel Wir bringen die lineare Regressionsgleichung in Matrixform

Wie es gemacht wird? Die Klammern werden geöffnet, die Differenzierung durchgeführt, die resultierenden Ausdrücke transformiert usw., und genau das werden wir jetzt tun.

Matrixtransformationen

Öffnen wir die Klammern

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Bereiten wir eine Differenzierungsgleichung vor

Dazu werden wir einige Transformationen durchführen. In späteren Berechnungen wird es für uns bequemer sein, wenn der Vektor Wir bringen die lineare Regressionsgleichung in Matrixform wird am Anfang jedes Produkts in der Gleichung dargestellt.

Konvertierung 1

Wir bringen die lineare Regressionsgleichung in Matrixform

Wie ist es passiert? Um diese Frage zu beantworten, schauen Sie sich einfach die Größen der zu multiplizierenden Matrizen an und stellen Sie fest, dass wir am Ausgang eine Zahl oder eine andere Zahl erhalten Wir bringen die lineare Regressionsgleichung in Matrixform.

Schreiben wir die Größen von Matrixausdrücken auf.

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Konvertierung 2

Wir bringen die lineare Regressionsgleichung in Matrixform

Schreiben wir es ähnlich wie Transformation 1

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Am Ausgang erhalten wir eine Gleichung, die wir differenzieren müssen:
Wir bringen die lineare Regressionsgleichung in Matrixform

Wir unterscheiden die Funktion zur Bewertung der Modellqualität

Differenzieren wir nach dem Vektor Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Fragen warum Wir bringen die lineare Regressionsgleichung in Matrixform Dies sollte nicht der Fall sein, aber wir werden die Operationen zur Bestimmung von Ableitungen in den anderen beiden Ausdrücken genauer untersuchen.

Differenzierung 1

Lassen Sie uns die Differenzierung näher erläutern: Wir bringen die lineare Regressionsgleichung in Matrixform

Um die Ableitung einer Matrix oder eines Vektors zu bestimmen, müssen Sie sich ansehen, was sich darin befindet. Lass uns nachsehen:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform Wir bringen die lineare Regressionsgleichung in Matrixform

Bezeichnen wir das Produkt von Matrizen Wir bringen die lineare Regressionsgleichung in Matrixform durch die Matrix Wir bringen die lineare Regressionsgleichung in Matrixform. Matrix Wir bringen die lineare Regressionsgleichung in Matrixform quadratisch und darüber hinaus symmetrisch. Diese Eigenschaften werden uns später nützlich sein, erinnern wir uns an sie. Matrix Wir bringen die lineare Regressionsgleichung in Matrixform hat Dimension Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Unsere Aufgabe besteht nun darin, die Vektoren korrekt mit der Matrix zu multiplizieren und nicht „zweimal zwei ist fünf“ zu erhalten. Konzentrieren wir uns also und seien wir äußerst vorsichtig.

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir haben jedoch einen komplizierten Ausdruck erreicht! Tatsächlich haben wir eine Zahl erhalten – einen Skalar. Und jetzt kommen wir tatsächlich zur Differenzierung. Für jeden Koeffizienten muss die Ableitung des resultierenden Ausdrucks ermittelt werden Wir bringen die lineare Regressionsgleichung in Matrixform und erhalten Sie den Dimensionsvektor als Ausgabe Wir bringen die lineare Regressionsgleichung in Matrixform. Für alle Fälle schreibe ich die Vorgehensweise nach Aktion auf:

1) differenzieren nach Wir bringen die lineare Regressionsgleichung in Matrixform, wir bekommen: Wir bringen die lineare Regressionsgleichung in Matrixform

2) differenzieren nach Wir bringen die lineare Regressionsgleichung in Matrixform, wir bekommen: Wir bringen die lineare Regressionsgleichung in Matrixform

3) differenzieren nach Wir bringen die lineare Regressionsgleichung in Matrixform, wir bekommen: Wir bringen die lineare Regressionsgleichung in Matrixform

Die Ausgabe ist der versprochene Größenvektor Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wenn Sie sich den Vektor genauer ansehen, werden Sie feststellen, dass die linken und entsprechenden rechten Elemente des Vektors so gruppiert werden können, dass im Ergebnis ein Vektor vom dargestellten Vektor isoliert werden kann Wir bringen die lineare Regressionsgleichung in Matrixform Größe Wir bringen die lineare Regressionsgleichung in Matrixform. Zum Beispiel Wir bringen die lineare Regressionsgleichung in Matrixform (linkes Element der oberen Zeile des Vektors) Wir bringen die lineare Regressionsgleichung in Matrixform (das rechte Element der oberen Zeile des Vektors) kann dargestellt werden als Wir bringen die lineare Regressionsgleichung in MatrixformUnd Wir bringen die lineare Regressionsgleichung in Matrixform - wie Wir bringen die lineare Regressionsgleichung in Matrixform usw. in jeder Zeile. Lassen Sie uns gruppieren:

Wir bringen die lineare Regressionsgleichung in Matrixform

Nehmen wir den Vektor heraus Wir bringen die lineare Regressionsgleichung in Matrixform und am Ausgang erhalten wir:

Wir bringen die lineare Regressionsgleichung in Matrixform

Schauen wir uns nun die resultierende Matrix genauer an. Die Matrix ist die Summe zweier Matrizen Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Erinnern wir uns daran, dass wir etwas früher eine wichtige Eigenschaft der Matrix bemerkt haben Wir bringen die lineare Regressionsgleichung in Matrixform - es ist symmetrisch. Basierend auf dieser Eigenschaft können wir mit Sicherheit sagen, dass der Ausdruck Wir bringen die lineare Regressionsgleichung in Matrixform ist gleich Wir bringen die lineare Regressionsgleichung in Matrixform. Dies kann leicht überprüft werden, indem das Produkt der Matrizen Element für Element erweitert wird Wir bringen die lineare Regressionsgleichung in Matrixform. Wir werden dies hier nicht tun; Interessenten können es selbst überprüfen.

Kehren wir zu unserem Ausdruck zurück. Nach unseren Transformationen ist es so geworden, wie wir es sehen wollten:

Wir bringen die lineare Regressionsgleichung in Matrixform

Damit haben wir die erste Differenzierung abgeschlossen. Kommen wir zum zweiten Ausdruck.

Differenzierung 2

Wir bringen die lineare Regressionsgleichung in Matrixform

Folgen wir den ausgetretenen Pfaden. Es wird viel kürzer sein als das vorherige, also entfernen Sie sich nicht zu weit vom Bildschirm.

Erweitern wir die Vektoren und die Matrix Element für Element:

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Lasst uns die beiden für eine Weile aus den Berechnungen herausnehmen – es spielt keine große Rolle, dann setzen wir es wieder an seinen Platz. Lassen Sie uns die Vektoren mit der Matrix multiplizieren. Lassen Sie uns zunächst die Matrix multiplizieren Wir bringen die lineare Regressionsgleichung in Matrixform zum Vektor Wir bringen die lineare Regressionsgleichung in Matrixform, wir haben hier keine Einschränkungen. Wir erhalten den Größenvektor Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Führen wir die folgende Aktion aus: Multiplizieren Sie den Vektor Wir bringen die lineare Regressionsgleichung in Matrixform zum resultierenden Vektor. Am Ausgang wartet die Nummer auf uns:

Wir bringen die lineare Regressionsgleichung in Matrixform

Dann werden wir es differenzieren. Als Ergebnis erhalten wir einen Dimensionsvektor Wir bringen die lineare Regressionsgleichung in Matrixform:

Wir bringen die lineare Regressionsgleichung in Matrixform

Erinnert mich etwas? Alles ist richtig! Dies ist das Produkt der Matrix Wir bringen die lineare Regressionsgleichung in Matrixform zum Vektor Wir bringen die lineare Regressionsgleichung in Matrixform.

Damit ist die zweite Differenzierung erfolgreich abgeschlossen.

Statt einer Schlussfolgerung

Jetzt wissen wir, wie es zur Gleichberechtigung kam Wir bringen die lineare Regressionsgleichung in Matrixform.

Abschließend beschreiben wir eine schnelle Möglichkeit, Grundformeln umzuwandeln.

Bewerten wir die Qualität des Modells anhand der Methode der kleinsten Quadrate:
Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Differenzieren wir den resultierenden Ausdruck:
Wir bringen die lineare Regressionsgleichung in Matrixform Wir bringen die lineare Regressionsgleichung in Matrixform

Wir bringen die lineare Regressionsgleichung in Matrixform

Literatur

Internetquellen:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Lehrbücher, Aufgabensammlungen:

1) Vorlesungsskript zur höheren Mathematik: vollständiger Kurs / D.T. Geschrieben – 4. Auflage. – M.: Iris-Presse, 2006
2) Angewandte Regressionsanalyse / N. Draper, G. Smith – 2. Aufl. – M.: Finanzen und Statistik, 1986 (Übersetzung aus dem Englischen)
3) Probleme zur Lösung von Matrixgleichungen:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Source: habr.com

Kommentar hinzufügen