Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Le but de l’article est de fournir un soutien aux data scientists débutants. DANS article précédent Nous avons décrit trois façons de résoudre une équation de régression linéaire : solution analytique, descente de gradient, descente de gradient stochastique. Ensuite pour la solution analytique nous avons appliqué la formule Nous mettons l'équation de régression linéaire sous forme matricielle. Dans cet article, comme le titre l’indique, nous justifierons l’utilisation de cette formule ou, en d’autres termes, nous la dériverons nous-mêmes.

Pourquoi il est logique d'accorder une attention particulière à la formule Nous mettons l'équation de régression linéaire sous forme matricielle?

C'est avec l'équation matricielle que l'on commence dans la plupart des cas à se familiariser avec la régression linéaire. Dans le même temps, les calculs détaillés sur la façon dont la formule a été dérivée sont rares.

Par exemple, dans les cours d'apprentissage automatique de Yandex, lorsque les étudiants sont initiés à la régularisation, il leur est proposé d'utiliser les fonctions de la bibliothèque. apprendre, alors que pas un mot n'est mentionné sur la représentation matricielle de l'algorithme. C'est à ce moment que certains auditeurs voudront peut-être comprendre ce problème plus en détail : écrire du code sans utiliser de fonctions prêtes à l'emploi. Et pour ce faire, il faut d’abord présenter l’équation avec un régulariseur sous forme matricielle. Cet article permettra à ceux qui souhaitent maîtriser de telles compétences. Commençons.

Conditions initiales

Indicateurs cibles

Nous avons une gamme de valeurs cibles. Par exemple, l’indicateur cible pourrait être le prix de n’importe quel actif : pétrole, or, blé, dollar, etc. Dans le même temps, par un certain nombre de valeurs d'indicateurs cibles, nous entendons le nombre d'observations. De telles observations pourraient être, par exemple, les prix mensuels du pétrole pour l’année, c’est-à-dire que nous aurons 12 valeurs cibles. Commençons par introduire la notation. Notons chaque valeur de l'indicateur cible comme Nous mettons l'équation de régression linéaire sous forme matricielle. Au total nous avons Nous mettons l'équation de régression linéaire sous forme matricielle observations, ce qui signifie que nous pouvons représenter nos observations comme Nous mettons l'équation de régression linéaire sous forme matricielle.

Régresseurs

Nous supposerons qu'il existe des facteurs qui expliquent dans une certaine mesure les valeurs de l'indicateur cible. Par exemple, le taux de change dollar/rouble est fortement influencé par le prix du pétrole, le taux de la Réserve fédérale, etc. De tels facteurs sont appelés régresseurs. Dans le même temps, chaque valeur d'indicateur cible doit correspondre à une valeur de régresseur, c'est-à-dire que si nous avons 12 indicateurs cibles pour chaque mois en 2018, alors nous devrions également avoir 12 valeurs de régresseur pour la même période. Notons les valeurs de chaque régresseur par Nous mettons l'équation de régression linéaire sous forme matricielle. Supposons que dans notre cas il y ait Nous mettons l'équation de régression linéaire sous forme matricielle régresseurs (c'est-à-dire Nous mettons l'équation de régression linéaire sous forme matricielle facteurs qui influencent les valeurs des indicateurs cibles). Cela signifie que nos régresseurs peuvent être présentés comme suit : pour le 1er régresseur (par exemple, le prix du pétrole) : Nous mettons l'équation de régression linéaire sous forme matricielle, pour le 2ème régresseur (par exemple, le taux de la Fed) : Nous mettons l'équation de régression linéaire sous forme matricielle, pour "Nous mettons l'équation de régression linéaire sous forme matricielle-ème" régresseur : Nous mettons l'équation de régression linéaire sous forme matricielle

Dépendance des indicateurs cibles sur les régresseurs

Supposons que la dépendance de l'indicateur cible Nous mettons l'équation de régression linéaire sous forme matricielle des régresseurs "Nous mettons l'équation de régression linéaire sous forme matricielleCette observation peut être exprimée par une équation de régression linéaire de la forme :

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle - “Nous mettons l'équation de régression linéaire sous forme matricielle-th" valeur du régresseur de 1 à Nous mettons l'équation de régression linéaire sous forme matricielle,

Nous mettons l'équation de régression linéaire sous forme matricielle — nombre de régresseurs de 1 à Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle — les coefficients angulaires, qui représentent l'ampleur de la variation moyenne de l'indicateur cible calculé lorsque le régresseur change.

Autrement dit, nous sommes pour tout le monde (sauf Nous mettons l'équation de régression linéaire sous forme matricielle) du régresseur on détermine « notre » coefficient Nous mettons l'équation de régression linéaire sous forme matricielle, puis multipliez les coefficients par les valeurs des régresseurs"Nous mettons l'équation de régression linéaire sous forme matriciellee" observation, on obtient ainsi une certaine approximation "Nous mettons l'équation de régression linéaire sous forme matricielle-th" indicateur cible.

Par conséquent, nous devons sélectionner de tels coefficients Nous mettons l'équation de régression linéaire sous forme matricielle, auquel les valeurs de notre fonction d'approximation Nous mettons l'équation de régression linéaire sous forme matricielle sera situé le plus près possible des valeurs cibles de l’indicateur.

Évaluer la qualité de la fonction d'approximation

Nous déterminerons l'évaluation de la qualité de la fonction d'approximation en utilisant la méthode des moindres carrés. La fonction d’évaluation de la qualité prendra dans ce cas la forme suivante :

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous devons sélectionner de telles valeurs des coefficients $w$ pour lesquelles la valeur Nous mettons l'équation de régression linéaire sous forme matricielle sera le plus petit.

Conversion de l'équation sous forme matricielle

Représentation vectorielle

Pour commencer, pour vous faciliter la vie, vous devez faire attention à l'équation de régression linéaire et remarquer que le premier coefficient Nous mettons l'équation de régression linéaire sous forme matricielle n’est multiplié par aucun régresseur. Dans le même temps, lorsque nous convertissons les données sous forme matricielle, la circonstance mentionnée ci-dessus compliquera sérieusement les calculs. À cet égard, il est proposé d'introduire un autre régresseur pour le premier coefficient Nous mettons l'équation de régression linéaire sous forme matricielle et l'assimiler à un. Ou plutôt, chaque "Nous mettons l'équation de régression linéaire sous forme matricielleassimilons la ième valeur de ce régresseur à un - après tout, multiplié par un, rien ne changera du point de vue du résultat des calculs, mais du point de vue des règles de produit des matrices, notre tourment sera considérablement réduit.

Maintenant, pour le moment, afin de simplifier le propos, supposons que nous n'en ayons qu'un "Nous mettons l'équation de régression linéaire sous forme matricielle-ème" observation. Ensuite, imaginez les valeurs des régresseurs"Nous mettons l'équation de régression linéaire sous forme matricielle-th" observations comme vecteur Nous mettons l'équation de régression linéaire sous forme matricielle. Vecteur Nous mettons l'équation de régression linéaire sous forme matricielle a une dimension Nous mettons l'équation de régression linéaire sous forme matricielleC'est-à- Nous mettons l'équation de régression linéaire sous forme matricielle lignes et 1 colonne :

Nous mettons l'équation de régression linéaire sous forme matricielle

Représentons les coefficients requis sous forme de vecteur Nous mettons l'équation de régression linéaire sous forme matricielle, ayant une dimension Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Équation de régression linéaire pour "Nous mettons l'équation de régression linéaire sous forme matricielle-ème" observation prendra la forme :

Nous mettons l'équation de régression linéaire sous forme matricielle

La fonction d'évaluation de la qualité d'un modèle linéaire prendra la forme :

Nous mettons l'équation de régression linéaire sous forme matricielle

Attention, conformément aux règles de multiplication matricielle, nous devions transposer le vecteur Nous mettons l'équation de régression linéaire sous forme matricielle.

Représentation matricielle

En multipliant les vecteurs, nous obtenons le nombre : Nous mettons l'équation de régression linéaire sous forme matricielle, ce à quoi il faut s'attendre. Ce nombre est l'approximation "Nous mettons l'équation de régression linéaire sous forme matricielle-th" indicateur cible. Mais nous avons besoin d’une approximation non pas d’une seule valeur cible, mais de toutes. Pour ce faire, notons tout »Nous mettons l'équation de régression linéaire sous forme matricielle"th" régresseurs au format matriciel Nous mettons l'équation de régression linéaire sous forme matricielle. La matrice résultante a la dimension Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

L’équation de régression linéaire prendra maintenant la forme :

Nous mettons l'équation de régression linéaire sous forme matricielle

Désignons les valeurs des indicateurs cibles (tous Nous mettons l'équation de régression linéaire sous forme matricielle) par vecteur Nous mettons l'équation de régression linéaire sous forme matricielle dimension Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous pouvons maintenant écrire l'équation pour évaluer la qualité d'un modèle linéaire sous forme matricielle :

Nous mettons l'équation de régression linéaire sous forme matricielle

En fait, à partir de cette formule, nous obtenons en outre la formule que nous connaissons Nous mettons l'équation de régression linéaire sous forme matricielle

Comment c'est fait? Les parenthèses sont ouvertes, la différenciation est effectuée, les expressions résultantes sont transformées, etc., et c'est exactement ce que nous allons faire maintenant.

Transformations matricielles

Ouvrons les parenthèses

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Préparons une équation de différenciation

Pour ce faire, nous allons procéder à quelques transformations. Dans les calculs ultérieurs, il nous sera plus pratique si le vecteur Nous mettons l'équation de régression linéaire sous forme matricielle sera représenté au début de chaque produit de l’équation.

Transformation 1

Nous mettons l'équation de régression linéaire sous forme matricielle

Comment est-ce arrivé? Pour répondre à cette question, il suffit de regarder les tailles des matrices multipliées et de voir qu'en sortie on obtient un nombre ou autre Nous mettons l'équation de régression linéaire sous forme matricielle.

Écrivons les tailles des expressions matricielles.

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Transformation 2

Nous mettons l'équation de régression linéaire sous forme matricielle

Écrivons-le de la même manière que la transformation 1

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

En sortie, nous obtenons une équation que nous devons différencier :
Nous mettons l'équation de régression linéaire sous forme matricielle

Nous différencions la fonction d'évaluation de la qualité du modèle

Différencions par rapport au vecteur Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Questions pourquoi Nous mettons l'équation de régression linéaire sous forme matricielle cela ne devrait pas être le cas, mais nous examinerons plus en détail les opérations de détermination des dérivées dans les deux autres expressions.

Différenciation 1

Développons la différenciation : Nous mettons l'équation de régression linéaire sous forme matricielle

Afin de déterminer la dérivée d’une matrice ou d’un vecteur, vous devez regarder ce qu’ils contiennent. Regardons:

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle Nous mettons l'équation de régression linéaire sous forme matricielle

Notons le produit des matrices Nous mettons l'équation de régression linéaire sous forme matricielle à travers la matrice Nous mettons l'équation de régression linéaire sous forme matricielle. La matrice Nous mettons l'équation de régression linéaire sous forme matricielle carré et en plus, il est symétrique. Ces propriétés nous seront utiles plus tard, rappelons-les. Matrice Nous mettons l'équation de régression linéaire sous forme matricielle a une dimension Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Maintenant, notre tâche est de multiplier correctement les vecteurs par la matrice et de ne pas obtenir « deux fois deux font cinq », alors concentrons-nous et soyons extrêmement prudents.

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Cependant, nous avons obtenu une expression complexe ! En fait, nous avons un nombre – un scalaire. Et maintenant, pour de vrai, passons à la différenciation. Il faut trouver la dérivée de l'expression résultante pour chaque coefficient Nous mettons l'équation de régression linéaire sous forme matricielle et obtenez le vecteur de dimension en sortie Nous mettons l'équation de régression linéaire sous forme matricielle. Au cas où, j'écrirai les procédures par action :

1) différencier par Nous mettons l'équation de régression linéaire sous forme matricielle, on a: Nous mettons l'équation de régression linéaire sous forme matricielle

2) différencier par Nous mettons l'équation de régression linéaire sous forme matricielle, on a: Nous mettons l'équation de régression linéaire sous forme matricielle

3) différencier par Nous mettons l'équation de régression linéaire sous forme matricielle, on a: Nous mettons l'équation de régression linéaire sous forme matricielle

La sortie est le vecteur de taille promis Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Si vous regardez le vecteur de plus près, vous remarquerez que les éléments gauche et droit correspondant du vecteur peuvent être regroupés de telle manière que, par conséquent, un vecteur peut être isolé du vecteur présenté. Nous mettons l'équation de régression linéaire sous forme matricielle taille Nous mettons l'équation de régression linéaire sous forme matricielle. Par exemple, Nous mettons l'équation de régression linéaire sous forme matricielle (élément gauche de la ligne supérieure du vecteur) Nous mettons l'équation de régression linéaire sous forme matricielle (l'élément droit de la ligne supérieure du vecteur) peut être représenté comme Nous mettons l'équation de régression linéaire sous forme matricielleEt Nous mettons l'équation de régression linéaire sous forme matricielle - comme Nous mettons l'équation de régression linéaire sous forme matricielle etc. sur chaque ligne. Regroupons :

Nous mettons l'équation de régression linéaire sous forme matricielle

Supprimons le vecteur Nous mettons l'équation de régression linéaire sous forme matricielle et en sortie on obtient :

Nous mettons l'équation de régression linéaire sous forme matricielle

Examinons maintenant de plus près la matrice résultante. La matrice est la somme de deux matrices Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Rappelons qu'un peu plus tôt nous avions noté une propriété importante de la matrice Nous mettons l'équation de régression linéaire sous forme matricielle - c'est symétrique. Sur la base de cette propriété, nous pouvons affirmer avec certitude que l'expression Nous mettons l'équation de régression linéaire sous forme matricielle égal Nous mettons l'équation de régression linéaire sous forme matricielle. Cela peut être facilement vérifié en développant le produit des matrices élément par élément Nous mettons l'équation de régression linéaire sous forme matricielle. Nous ne le ferons pas ici, les personnes intéressées peuvent le vérifier elles-mêmes.

Revenons à notre expression. Après nos transformations, cela s’est passé comme nous voulions le voir :

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous avons donc terminé la première différenciation. Passons à la deuxième expression.

Différenciation 2

Nous mettons l'équation de régression linéaire sous forme matricielle

Suivons les sentiers battus. Il sera beaucoup plus court que le précédent, alors ne vous éloignez pas trop de l'écran.

Développons les vecteurs et la matrice élément par élément :

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Supprimons les deux des calculs pendant un moment - cela ne joue pas un grand rôle, puis nous le remettrons à sa place. Multiplions les vecteurs par la matrice. Tout d'abord, multiplions la matrice Nous mettons l'équation de régression linéaire sous forme matricielle vecteur Nous mettons l'équation de régression linéaire sous forme matricielle, nous n'avons aucune restriction ici. On obtient le vecteur taille Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Effectuons l'action suivante - multiplions le vecteur Nous mettons l'équation de régression linéaire sous forme matricielle au vecteur résultant. A la sortie le numéro nous attendra :

Nous mettons l'équation de régression linéaire sous forme matricielle

Ensuite, nous le différencierons. En sortie on obtient un vecteur de dimension Nous mettons l'équation de régression linéaire sous forme matricielle:

Nous mettons l'équation de régression linéaire sous forme matricielle

Cela me rappelle quelque chose ? C'est exact! C'est le produit de la matrice Nous mettons l'équation de régression linéaire sous forme matricielle vecteur Nous mettons l'équation de régression linéaire sous forme matricielle.

Ainsi, la deuxième différenciation est réalisée avec succès.

Au lieu d'une conclusion

Maintenant nous savons comment l'égalité est née Nous mettons l'équation de régression linéaire sous forme matricielle.

Enfin, nous décrirons une manière rapide de transformer des formules de base.

Évaluons la qualité du modèle selon la méthode des moindres carrés :
Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

Différencions l'expression résultante :
Nous mettons l'équation de régression linéaire sous forme matricielle Nous mettons l'équation de régression linéaire sous forme matricielle

Nous mettons l'équation de régression linéaire sous forme matricielle

littérature

Sources Internet :

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Manuels, recueils de problèmes :

1) Notes de cours sur les mathématiques supérieures : cours complet / D.T. Écrit – 4e éd. – M. : Iris-presse, 2006
2) Analyse de régression appliquée / N. Draper, G. Smith - 2e éd. – M. : Finances et Statistiques, 1986 (traduction de l’anglais)
3) Problèmes de résolution d'équations matricielles :
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Source: habr.com

Ajouter un commentaire