Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

O objetivo do artigo é fornecer suporte aos cientistas de dados iniciantes. EM artigo anterior Descrevemos três maneiras de resolver uma equação de regressão linear: solução analítica, descida gradiente, descida gradiente estocástica. Então para a solução analítica aplicamos a fórmula Trazemos a equação de regressão linear para a forma de matriz. Neste artigo, como o título sugere, justificaremos o uso desta fórmula ou, em outras palavras, nós mesmos a derivaremos.

Por que faz sentido prestar atenção extra à fórmula Trazemos a equação de regressão linear para a forma de matriz?

É com a equação matricial que na maioria dos casos se começa a familiarizar-se com a regressão linear. Ao mesmo tempo, cálculos detalhados de como a fórmula foi derivada são raros.

Por exemplo, em cursos de aprendizado de máquina da Yandex, quando os alunos são apresentados à regularização, eles podem usar funções da biblioteca aprender, embora nenhuma palavra seja mencionada sobre a representação matricial do algoritmo. É neste momento que alguns ouvintes podem querer entender esse assunto com mais detalhes - escrever código sem usar funções prontas. E para fazer isso, primeiro você deve apresentar a equação com um regularizador em forma de matriz. Este artigo permitirá que aqueles que desejam dominar tais habilidades. Vamos começar.

Condições iniciais

Indicadores de meta

Temos uma gama de valores-alvo. Por exemplo, o indicador alvo poderia ser o preço de qualquer ativo: petróleo, ouro, trigo, dólar, etc. Ao mesmo tempo, por um número de valores de indicadores-alvo entendemos o número de observações. Tais observações poderiam ser, por exemplo, os preços mensais do petróleo para o ano, ou seja, teremos 12 valores-alvo. Vamos começar a apresentar a notação. Vamos denotar cada valor do indicador de meta como Trazemos a equação de regressão linear para a forma de matriz. No total temos Trazemos a equação de regressão linear para a forma de matriz observações, o que significa que podemos representar nossas observações como Trazemos a equação de regressão linear para a forma de matriz.

Regressores

Assumiremos que existem fatores que explicam até certo ponto os valores do indicador-alvo. Por exemplo, a taxa de câmbio dólar/rublo é fortemente influenciada pelo preço do petróleo, pela taxa da Reserva Federal, etc. Tais factores são chamados regressores. Ao mesmo tempo, cada valor de indicador-alvo deve corresponder a um valor de regressor, ou seja, se tivermos 12 indicadores-alvo para cada mês de 2018, então deveremos ter também 12 valores de regressor para o mesmo período. Vamos denotar os valores de cada regressor por Trazemos a equação de regressão linear para a forma de matriz. Deixe no nosso caso haver Trazemos a equação de regressão linear para a forma de matriz regressores (ou seja, Trazemos a equação de regressão linear para a forma de matriz fatores que influenciam os valores do indicador-alvo). Isto significa que os nossos regressores podem ser apresentados da seguinte forma: para o 1º regressor (por exemplo, o preço do petróleo): Trazemos a equação de regressão linear para a forma de matriz, para o 2º regressor (por exemplo, a taxa do Fed): Trazemos a equação de regressão linear para a forma de matriz, para "Trazemos a equação de regressão linear para a forma de matriz-º" regressor: Trazemos a equação de regressão linear para a forma de matriz

Dependência dos indicadores-alvo dos regressores

Suponhamos que a dependência do indicador alvo Trazemos a equação de regressão linear para a forma de matriz dos regressores "Trazemos a equação de regressão linear para a forma de matriza" observação pode ser expressa através de uma equação de regressão linear da forma:

Trazemos a equação de regressão linear para a forma de matriz

Onde Trazemos a equação de regressão linear para a forma de matriz - "Trazemos a equação de regressão linear para a forma de matriz-ésimo" valor do regressor de 1 a Trazemos a equação de regressão linear para a forma de matriz,

Trazemos a equação de regressão linear para a forma de matriz — número de regressores de 1 a Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz — coeficientes angulares, que representam o valor pelo qual o indicador-alvo calculado irá variar, em média, quando o regressor mudar.

Em outras palavras, somos para todos (exceto Trazemos a equação de regressão linear para a forma de matriz) do regressor determinamos “nosso” coeficiente Trazemos a equação de regressão linear para a forma de matriz, então multiplique os coeficientes pelos valores dos regressores "Trazemos a equação de regressão linear para a forma de matriza" observação, como resultado obtemos uma certa aproximação "Trazemos a equação de regressão linear para a forma de matriz-th" indicador de meta.

Portanto, precisamos selecionar tais coeficientes Trazemos a equação de regressão linear para a forma de matriz, em que os valores da nossa função de aproximação Trazemos a equação de regressão linear para a forma de matriz estará localizado o mais próximo possível dos valores do indicador-alvo.

Avaliando a qualidade da função de aproximação

Determinaremos a avaliação da qualidade da função de aproximação usando o método dos mínimos quadrados. A função de avaliação da qualidade, neste caso, assumirá a seguinte forma:

Trazemos a equação de regressão linear para a forma de matriz

Precisamos selecionar os valores dos coeficientes $w$ para os quais o valor Trazemos a equação de regressão linear para a forma de matriz será o menor.

Convertendo a equação em forma de matriz

Representação vetorial

Para começar, para facilitar sua vida, você deve prestar atenção na equação de regressão linear e perceber que o primeiro coeficiente Trazemos a equação de regressão linear para a forma de matriz não é multiplicado por nenhum regressor. Ao mesmo tempo, quando convertemos os dados em forma matricial, a circunstância acima mencionada complicará seriamente os cálculos. Neste sentido, propõe-se a introdução de outro regressor para o primeiro coeficiente Trazemos a equação de regressão linear para a forma de matriz e igualá-lo a um. Ou melhor, cada "Trazemos a equação de regressão linear para a forma de matrizigualar o valor desse regressor a um - afinal, quando multiplicado por um, nada mudará do ponto de vista do resultado dos cálculos, mas do ponto de vista das regras para o produto de matrizes, nosso tormento será significativamente reduzido.

Agora, por enquanto, para simplificar o material, vamos supor que temos apenas um "Trazemos a equação de regressão linear para a forma de matriz-ª" observação. Então, imagine os valores dos regressores”Trazemos a equação de regressão linear para a forma de matriz-th" observações como um vetor Trazemos a equação de regressão linear para a forma de matriz. Vetor Trazemos a equação de regressão linear para a forma de matriz tem dimensão Trazemos a equação de regressão linear para a forma de matrizIsto é, Trazemos a equação de regressão linear para a forma de matriz linhas e 1 coluna:

Trazemos a equação de regressão linear para a forma de matriz

Vamos representar os coeficientes necessários como um vetor Trazemos a equação de regressão linear para a forma de matriz, tendo dimensão Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Equação de regressão linear para "Trazemos a equação de regressão linear para a forma de matriz-th" observação assumirá a forma:

Trazemos a equação de regressão linear para a forma de matriz

A função de avaliação da qualidade de um modelo linear terá a forma:

Trazemos a equação de regressão linear para a forma de matriz

Observe que, de acordo com as regras de multiplicação de matrizes, precisávamos transpor o vetor Trazemos a equação de regressão linear para a forma de matriz.

Representação matricial

Como resultado da multiplicação de vetores, obtemos o número: Trazemos a equação de regressão linear para a forma de matriz, o que é de se esperar. Este número é a aproximação "Trazemos a equação de regressão linear para a forma de matriz-th" indicador de meta. Mas precisamos de uma aproximação não apenas de um valor-alvo, mas de todos eles. Para fazer isso, vamos anotar tudo “Trazemos a equação de regressão linear para a forma de matriz-th" regressores em formato de matriz Trazemos a equação de regressão linear para a forma de matriz. A matriz resultante tem a dimensão Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Agora a equação de regressão linear terá a forma:

Trazemos a equação de regressão linear para a forma de matriz

Vamos denotar os valores dos indicadores-alvo (todos Trazemos a equação de regressão linear para a forma de matriz) por vetor Trazemos a equação de regressão linear para a forma de matriz dimensão Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Agora podemos escrever a equação para avaliar a qualidade de um modelo linear em formato matricial:

Trazemos a equação de regressão linear para a forma de matriz

Na verdade, a partir desta fórmula obtemos ainda a fórmula que conhecemos Trazemos a equação de regressão linear para a forma de matriz

Como isso é feito? Os colchetes são abertos, a diferenciação é feita, as expressões resultantes são transformadas, etc., e é exatamente isso que faremos agora.

Transformações matriciais

Vamos abrir os colchetes

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Vamos preparar uma equação para diferenciação

Para isso, realizaremos algumas transformações. Nos cálculos subsequentes, será mais conveniente para nós se o vetor Trazemos a equação de regressão linear para a forma de matriz será representado no início de cada produto da equação.

Conversão 1

Trazemos a equação de regressão linear para a forma de matriz

Como isso aconteceu? Para responder a essa pergunta, basta olhar para os tamanhos das matrizes que estão sendo multiplicadas e ver que na saída obtemos um número ou não Trazemos a equação de regressão linear para a forma de matriz.

Vamos anotar os tamanhos das expressões matriciais.

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Conversão 2

Trazemos a equação de regressão linear para a forma de matriz

Vamos escrevê-lo de forma semelhante à transformação 1

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Na saída obtemos uma equação que temos que diferenciar:
Trazemos a equação de regressão linear para a forma de matriz

Diferenciamos a função de avaliação da qualidade do modelo

Vamos diferenciar em relação ao vetor Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Perguntas por que Trazemos a equação de regressão linear para a forma de matriz não deveria haver, mas examinaremos com mais detalhes as operações para determinar derivadas nas outras duas expressões.

Diferenciação 1

Vamos expandir a diferenciação: Trazemos a equação de regressão linear para a forma de matriz

Para determinar a derivada de uma matriz ou vetor, você precisa observar o que está dentro deles. Vamos olhar:

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz Trazemos a equação de regressão linear para a forma de matriz

Vamos denotar o produto de matrizes Trazemos a equação de regressão linear para a forma de matriz através da matriz Trazemos a equação de regressão linear para a forma de matriz. O Matrix Trazemos a equação de regressão linear para a forma de matriz quadrado e, além disso, é simétrico. Essas propriedades nos serão úteis mais tarde, vamos lembrá-las. Matriz Trazemos a equação de regressão linear para a forma de matriz tem dimensão Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Agora nossa tarefa é multiplicar corretamente os vetores pela matriz e não obter “duas vezes dois é cinco”, então vamos nos concentrar e ser extremamente cuidadosos.

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

No entanto, conseguimos uma expressão complexa! Na verdade, obtivemos um número - um escalar. E agora, de verdade, passamos à diferenciação. É necessário encontrar a derivada da expressão resultante para cada coeficiente Trazemos a equação de regressão linear para a forma de matriz e obtenha o vetor de dimensão como saída Trazemos a equação de regressão linear para a forma de matriz. Por precaução, anotarei os procedimentos por ação:

1) diferencie por Trazemos a equação de regressão linear para a forma de matriz, Nós temos: Trazemos a equação de regressão linear para a forma de matriz

2) diferencie por Trazemos a equação de regressão linear para a forma de matriz, Nós temos: Trazemos a equação de regressão linear para a forma de matriz

3) diferencie por Trazemos a equação de regressão linear para a forma de matriz, Nós temos: Trazemos a equação de regressão linear para a forma de matriz

A saída é o vetor de tamanho prometido Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Se você olhar o vetor mais de perto, notará que os elementos esquerdo e direito correspondentes do vetor podem ser agrupados de tal forma que, como resultado, um vetor pode ser isolado do vetor apresentado Trazemos a equação de regressão linear para a forma de matriz tamanho Trazemos a equação de regressão linear para a forma de matriz. Por exemplo, Trazemos a equação de regressão linear para a forma de matriz (elemento esquerdo da linha superior do vetor) Trazemos a equação de regressão linear para a forma de matriz (o elemento direito da linha superior do vetor) pode ser representado como Trazemos a equação de regressão linear para a forma de matrizE Trazemos a equação de regressão linear para a forma de matriz - Como Trazemos a equação de regressão linear para a forma de matriz etc. em cada linha. Vamos agrupar:

Trazemos a equação de regressão linear para a forma de matriz

Vamos retirar o vetor Trazemos a equação de regressão linear para a forma de matriz e na saída obtemos:

Trazemos a equação de regressão linear para a forma de matriz

Agora, vamos dar uma olhada mais de perto na matriz resultante. A matriz é a soma de duas matrizes Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Lembremos que um pouco antes notamos uma propriedade importante da matriz Trazemos a equação de regressão linear para a forma de matriz - é simétrico. Com base nesta propriedade, podemos dizer com segurança que a expressão Trazemos a equação de regressão linear para a forma de matriz é igual Trazemos a equação de regressão linear para a forma de matriz. Isso pode ser facilmente verificado expandindo o produto das matrizes elemento por elemento Trazemos a equação de regressão linear para a forma de matriz. Não faremos isso aqui, os interessados ​​podem conferir por conta própria.

Voltemos à nossa expressão. Após nossas transformações, ficou do jeito que queríamos:

Trazemos a equação de regressão linear para a forma de matriz

Então, completamos a primeira diferenciação. Vamos passar para a segunda expressão.

Diferenciação 2

Trazemos a equação de regressão linear para a forma de matriz

Vamos seguir o caminho batido. Será bem mais curto que o anterior, então não se afaste muito da tela.

Vamos expandir os vetores e a matriz elemento por elemento:

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Vamos remover os dois dos cálculos por um tempo - isso não desempenha um grande papel, então vamos colocá-los de volta em seu lugar. Vamos multiplicar os vetores pela matriz. Primeiro de tudo, vamos multiplicar a matriz Trazemos a equação de regressão linear para a forma de matriz para vetorizar Trazemos a equação de regressão linear para a forma de matriz, não temos restrições aqui. Obtemos o vetor de tamanho Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Vamos realizar a seguinte ação - multiplicar o vetor Trazemos a equação de regressão linear para a forma de matriz ao vetor resultante. Na saída o número estará nos esperando:

Trazemos a equação de regressão linear para a forma de matriz

Então vamos diferenciá-lo. Na saída obtemos um vetor de dimensão Trazemos a equação de regressão linear para a forma de matriz:

Trazemos a equação de regressão linear para a forma de matriz

Lembra-me de alguma coisa? Isso mesmo! Este é o produto da matriz Trazemos a equação de regressão linear para a forma de matriz para vetorizar Trazemos a equação de regressão linear para a forma de matriz.

Assim, a segunda diferenciação é concluída com sucesso.

Em vez de uma conclusão

Agora sabemos como surgiu a igualdade Trazemos a equação de regressão linear para a forma de matriz.

Finalmente, descreveremos uma maneira rápida de transformar fórmulas básicas.

Vamos avaliar a qualidade do modelo de acordo com o método dos mínimos quadrados:
Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Vamos diferenciar a expressão resultante:
Trazemos a equação de regressão linear para a forma de matriz Trazemos a equação de regressão linear para a forma de matriz

Trazemos a equação de regressão linear para a forma de matriz

Literatura

Fontes da Internet:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Livros didáticos, coleções de problemas:

1) Notas de aula sobre matemática superior: curso completo / D.T. Escrito – 4ª ed. – M.: Iris-press, 2006
2) Análise de regressão aplicada / N. Draper, G. Smith - 2ª ed. – M.: Finanças e Estatística, 1986 (tradução do inglês)
3) Problemas para resolver equações matriciais:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Fonte: habr.com

Adicionar um comentário