Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Lo scopo dell'articolo è fornire supporto ai data scientist principianti. IN articolo precedente Abbiamo delineato tre modi per risolvere un'equazione di regressione lineare: soluzione analitica, discesa del gradiente, discesa del gradiente stocastica. Quindi per la soluzione analitica abbiamo applicato la formula Portiamo l'equazione di regressione lineare in forma di matrice. In questo articolo, come suggerisce il titolo, giustificheremo l'uso di questa formula o, in altre parole, la deriveremo noi stessi.

Perché ha senso prestare particolare attenzione alla formula Portiamo l'equazione di regressione lineare in forma di matrice?

È con l'equazione di matrice che nella maggior parte dei casi si inizia a familiarizzare con la regressione lineare. Allo stesso tempo, i calcoli dettagliati su come è stata derivata la formula sono rari.

Ad esempio, nei corsi di machine learning di Yandex, quando agli studenti viene introdotta la regolarizzazione, viene loro offerto di utilizzare le funzioni della libreria sklearn, mentre non viene menzionata una parola sulla rappresentazione matriciale dell'algoritmo. È in questo momento che alcuni ascoltatori potrebbero voler comprendere questo problema in modo più dettagliato: scrivere codice senza utilizzare funzioni già pronte. E per fare ciò, devi prima presentare l'equazione con un regolarizzatore sotto forma di matrice. Questo articolo consentirà a coloro che desiderano padroneggiare tali abilità. Iniziamo.

Condizioni iniziali

Indicatori di obiettivo

Abbiamo una gamma di valori target. Ad esempio, l’indicatore target potrebbe essere il prezzo di qualsiasi asset: petrolio, oro, grano, dollaro, ecc. Allo stesso tempo, per numero di valori dell'indicatore target intendiamo il numero di osservazioni. Tali osservazioni potrebbero essere, ad esempio, i prezzi mensili del petrolio per l'anno, ovvero avremo 12 valori target. Iniziamo introducendo la notazione. Indichiamo ciascun valore dell'indicatore target come Portiamo l'equazione di regressione lineare in forma di matrice. In totale abbiamo Portiamo l'equazione di regressione lineare in forma di matrice osservazioni, il che significa che possiamo rappresentare le nostre osservazioni come Portiamo l'equazione di regressione lineare in forma di matrice.

Regressori

Assumeremo che ci siano fattori che in una certa misura spiegano i valori dell’indicatore target. Ad esempio, il tasso di cambio dollaro/rublo è fortemente influenzato dal prezzo del petrolio, dal tasso della Federal Reserve, ecc. Tali fattori sono chiamati regressori. Allo stesso tempo, ciascun valore dell’indicatore target deve corrispondere a un valore regressore, ovvero se abbiamo 12 indicatori target per ogni mese nel 2018, allora dovremmo avere anche 12 valori regressori per lo stesso periodo. Indichiamo i valori di ciascun regressore con Portiamo l'equazione di regressione lineare in forma di matrice. Lasciamo che nel nostro caso ci sia Portiamo l'equazione di regressione lineare in forma di matrice regressori (es. Portiamo l'equazione di regressione lineare in forma di matrice fattori che influenzano i valori degli indicatori target). Ciò significa che i nostri regressori possono essere presentati come segue: per il primo regressore (ad esempio, il prezzo del petrolio): Portiamo l'equazione di regressione lineare in forma di matrice, per il 2° regressore (ad esempio, il tasso della Fed): Portiamo l'equazione di regressione lineare in forma di matrice, per "Portiamo l'equazione di regressione lineare in forma di matrice-esimo" regressore: Portiamo l'equazione di regressione lineare in forma di matrice

Dipendenza degli indicatori target dai regressori

Supponiamo che la dipendenza dell'indicatore target Portiamo l'equazione di regressione lineare in forma di matrice dai regressori"Portiamo l'equazione di regressione lineare in forma di matriceL'osservazione può essere espressa attraverso un'equazione di regressione lineare della forma:

Portiamo l'equazione di regressione lineare in forma di matrice

Dove Portiamo l'equazione di regressione lineare in forma di matrice - "Portiamo l'equazione di regressione lineare in forma di matrice-th" valore del regressore da 1 a Portiamo l'equazione di regressione lineare in forma di matrice,

Portiamo l'equazione di regressione lineare in forma di matrice — numero di regressori da 1 a Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice — coefficienti angolari, che rappresentano l'entità della variazione media dell'indicatore obiettivo calcolato al variare del regressore.

In altre parole, siamo per tutti (tranne Portiamo l'equazione di regressione lineare in forma di matrice) del regressore determiniamo il “nostro” coefficiente Portiamo l'equazione di regressione lineare in forma di matrice, quindi moltiplicare i coefficienti per i valori dei regressori "Portiamo l'equazione di regressione lineare in forma di matriceth" osservazione, di conseguenza otteniamo una certa approssimazione "Portiamo l'equazione di regressione lineare in forma di matrice-th" indicatore di destinazione.

Pertanto, dobbiamo selezionare tali coefficienti Portiamo l'equazione di regressione lineare in forma di matrice, a cui si approssimano i valori della nostra funzione Portiamo l'equazione di regressione lineare in forma di matrice sarà posizionato il più vicino possibile ai valori dell'indicatore target.

Valutare la qualità della funzione approssimante

Determineremo la valutazione della qualità della funzione approssimante utilizzando il metodo dei minimi quadrati. La funzione di valutazione della qualità in questo caso assumerà la seguente forma:

Portiamo l'equazione di regressione lineare in forma di matrice

Dobbiamo selezionare tali valori dei coefficienti $w$ per i quali il valore Portiamo l'equazione di regressione lineare in forma di matrice sarà il più piccolo.

Conversione dell'equazione in forma matriciale

Rappresentazione vettoriale

Per cominciare, per semplificarti la vita, dovresti prestare attenzione all'equazione di regressione lineare e notare che il primo coefficiente Portiamo l'equazione di regressione lineare in forma di matrice non viene moltiplicato per alcun regressore. Allo stesso tempo, quando convertiamo i dati in forma matriciale, la circostanza sopra menzionata complicherà seriamente i calcoli. A questo proposito si propone di introdurre un altro regressore per il primo coefficiente Portiamo l'equazione di regressione lineare in forma di matrice e equipararlo a uno. O meglio, ogni"Portiamo l'equazione di regressione lineare in forma di matriceequiparare l'esimo valore di questo regressore a uno - dopotutto, se moltiplicato per uno, nulla cambierà dal punto di vista del risultato dei calcoli, ma dal punto di vista delle regole per il prodotto delle matrici, il nostro tormento sarà notevolmente ridotto.

Ora, per il momento, per semplificare il materiale, supponiamo di averne uno solo"Portiamo l'equazione di regressione lineare in forma di matrice-esima" osservazione. Quindi, immaginate i valori dei regressori”Portiamo l'equazione di regressione lineare in forma di matrice-th" osservazioni come vettore Portiamo l'equazione di regressione lineare in forma di matrice. Vettore Portiamo l'equazione di regressione lineare in forma di matrice ha dimensione Portiamo l'equazione di regressione lineare in forma di matriceCioè, Portiamo l'equazione di regressione lineare in forma di matrice righe e 1 colonna:

Portiamo l'equazione di regressione lineare in forma di matrice

Rappresentiamo i coefficienti richiesti come un vettore Portiamo l'equazione di regressione lineare in forma di matrice, avente dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Equazione di regressione lineare per "Portiamo l'equazione di regressione lineare in forma di matrice-th" l'osservazione assumerà la forma:

Portiamo l'equazione di regressione lineare in forma di matrice

La funzione per valutare la qualità di un modello lineare assumerà la forma:

Portiamo l'equazione di regressione lineare in forma di matrice

Tieni presente che in conformità con le regole della moltiplicazione delle matrici, dovevamo trasporre il vettore Portiamo l'equazione di regressione lineare in forma di matrice.

Rappresentazione matriciale

Come risultato della moltiplicazione dei vettori, otteniamo il numero: Portiamo l'equazione di regressione lineare in forma di matrice, cosa che c'è da aspettarselo. Questo numero è l'approssimazione "Portiamo l'equazione di regressione lineare in forma di matrice-th" indicatore di destinazione. Ma abbiamo bisogno di un’approssimazione non solo di un valore obiettivo, ma di tutti. Per farlo scriviamo tutto”Portiamo l'equazione di regressione lineare in forma di matrice-th" regressori in formato matrice Portiamo l'equazione di regressione lineare in forma di matrice. La matrice risultante ha la dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Ora l'equazione di regressione lineare assumerà la forma:

Portiamo l'equazione di regressione lineare in forma di matrice

Indichiamo i valori degli indicatori target (all Portiamo l'equazione di regressione lineare in forma di matrice) per vettore Portiamo l'equazione di regressione lineare in forma di matrice dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Ora possiamo scrivere l'equazione per valutare la qualità di un modello lineare in formato matriciale:

Portiamo l'equazione di regressione lineare in forma di matrice

In realtà da questa formula si ottiene ulteriormente la formula a noi nota Portiamo l'equazione di regressione lineare in forma di matrice

Come è fatto? Si aprono le parentesi, si effettua la differenziazione, si trasformano le espressioni risultanti, ecc., ed è esattamente ciò che faremo ora.

Trasformazioni di matrici

Apriamo le parentesi

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Prepariamo un'equazione per la derivazione

Per fare ciò, effettueremo alcune trasformazioni. Nei calcoli successivi sarà più conveniente per noi se il vettore Portiamo l'equazione di regressione lineare in forma di matrice sarà rappresentato all'inizio di ciascun prodotto nell'equazione.

Conversione 1

Portiamo l'equazione di regressione lineare in forma di matrice

Come è successo? Per rispondere a questa domanda basta guardare le dimensioni delle matrici da moltiplicare e vedere che in uscita otteniamo un numero o meno Portiamo l'equazione di regressione lineare in forma di matrice.

Annotiamo le dimensioni delle espressioni di matrice.

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Conversione 2

Portiamo l'equazione di regressione lineare in forma di matrice

Scriviamolo in modo simile alla trasformazione 1

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

In uscita otteniamo un'equazione che dobbiamo differenziare:
Portiamo l'equazione di regressione lineare in forma di matrice

Differenziamo la funzione di valutazione della qualità del modello

Differenziamo rispetto al vettore Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Domande sul perché Portiamo l'equazione di regressione lineare in forma di matrice non dovrebbe esserci, ma esamineremo più in dettaglio le operazioni per determinare le derivate nelle altre due espressioni.

Differenziazione 1

Espandiamo la differenziazione: Portiamo l'equazione di regressione lineare in forma di matrice

Per determinare la derivata di una matrice o di un vettore, devi guardare cosa c'è al loro interno. Guardiamo:

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice Portiamo l'equazione di regressione lineare in forma di matrice

Indichiamo il prodotto di matrici Portiamo l'equazione di regressione lineare in forma di matrice attraverso la matrice Portiamo l'equazione di regressione lineare in forma di matrice. Matrice Portiamo l'equazione di regressione lineare in forma di matrice quadrato e inoltre è simmetrico. Queste proprietà ci saranno utili in seguito, ricordiamocele. Matrice Portiamo l'equazione di regressione lineare in forma di matrice ha dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Ora il nostro compito è moltiplicare correttamente i vettori per la matrice e non ottenere “due volte due fa cinque”, quindi concentriamoci e stiamo estremamente attenti.

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Tuttavia, abbiamo ottenuto un'espressione complessa! In effetti, abbiamo un numero: uno scalare. E ora passiamo davvero alla differenziazione. È necessario trovare la derivata dell'espressione risultante per ciascun coefficiente Portiamo l'equazione di regressione lineare in forma di matrice e ottieni il vettore di dimensione come output Portiamo l'equazione di regressione lineare in forma di matrice. Per ogni evenienza, scriverò le procedure per azione:

1) differenziare per Portiamo l'equazione di regressione lineare in forma di matrice, noi abbiamo: Portiamo l'equazione di regressione lineare in forma di matrice

2) differenziare per Portiamo l'equazione di regressione lineare in forma di matrice, noi abbiamo: Portiamo l'equazione di regressione lineare in forma di matrice

3) differenziare per Portiamo l'equazione di regressione lineare in forma di matrice, noi abbiamo: Portiamo l'equazione di regressione lineare in forma di matrice

L'output è il vettore di dimensione promesso Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Se osservi il vettore più da vicino, noterai che gli elementi sinistro e destro corrispondente del vettore possono essere raggruppati in modo tale che, di conseguenza, un vettore possa essere isolato dal vettore presentato Portiamo l'equazione di regressione lineare in forma di matrice la dimensione Portiamo l'equazione di regressione lineare in forma di matrice. Ad esempio, Portiamo l'equazione di regressione lineare in forma di matrice (elemento sinistro della linea superiore del vettore) Portiamo l'equazione di regressione lineare in forma di matrice (l'elemento destro della linea superiore del vettore) può essere rappresentato come Portiamo l'equazione di regressione lineare in forma di matriceE Portiamo l'equazione di regressione lineare in forma di matrice - come Portiamo l'equazione di regressione lineare in forma di matrice eccetera. su ogni riga. Raggruppiamo:

Portiamo l'equazione di regressione lineare in forma di matrice

Eliminiamo il vettore Portiamo l'equazione di regressione lineare in forma di matrice e in uscita otteniamo:

Portiamo l'equazione di regressione lineare in forma di matrice

Ora diamo uno sguardo più da vicino alla matrice risultante. La matrice è la somma di due matrici Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Ricordiamo che poco prima abbiamo notato un'importante proprietà della matrice Portiamo l'equazione di regressione lineare in forma di matrice - è simmetrico. Sulla base di questa proprietà, possiamo dire con sicurezza che l'espressione Portiamo l'equazione di regressione lineare in forma di matrice uguale Portiamo l'equazione di regressione lineare in forma di matrice. Ciò può essere facilmente verificato espandendo il prodotto delle matrici elemento per elemento Portiamo l'equazione di regressione lineare in forma di matrice. Non lo faremo qui, chi è interessato può verificarlo da solo.

Torniamo alla nostra espressione. Dopo le nostre trasformazioni, è risultato come volevamo vederlo:

Portiamo l'equazione di regressione lineare in forma di matrice

Abbiamo quindi completato la prima differenziazione. Passiamo alla seconda espressione.

Differenziazione 2

Portiamo l'equazione di regressione lineare in forma di matrice

Seguiamo il sentiero battuto. Sarà molto più breve del precedente, quindi non allontanarti troppo dallo schermo.

Espandiamo i vettori e la matrice elemento per elemento:

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Togliamo per un po' questi due dai calcoli: non giocano un ruolo importante, poi li rimetteremo al loro posto. Moltiplichiamo i vettori per la matrice. Prima di tutto moltiplichiamo la matrice Portiamo l'equazione di regressione lineare in forma di matrice vettore Portiamo l'equazione di regressione lineare in forma di matrice, non abbiamo restrizioni qui. Otteniamo il vettore dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Eseguiamo la seguente azione: moltiplichiamo il vettore Portiamo l'equazione di regressione lineare in forma di matrice al vettore risultante. All'uscita ci aspetterà il numero:

Portiamo l'equazione di regressione lineare in forma di matrice

Poi lo differenziamo. In uscita otteniamo un vettore di dimensione Portiamo l'equazione di regressione lineare in forma di matrice:

Portiamo l'equazione di regressione lineare in forma di matrice

Mi ricorda qualcosa? Giusto! Questo è il prodotto della matrice Portiamo l'equazione di regressione lineare in forma di matrice vettore Portiamo l'equazione di regressione lineare in forma di matrice.

Pertanto, la seconda differenziazione è completata con successo.

Invece di una conclusione

Ora sappiamo come è arrivata all’uguaglianza Portiamo l'equazione di regressione lineare in forma di matrice.

Infine, descriveremo un modo rapido per trasformare le formule di base.

Valutiamo la qualità del modello secondo il metodo dei minimi quadrati:
Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Differenziamo l'espressione risultante:
Portiamo l'equazione di regressione lineare in forma di matrice Portiamo l'equazione di regressione lineare in forma di matrice

Portiamo l'equazione di regressione lineare in forma di matrice

Letteratura

Fonti Internet:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Libri di testo, raccolte di problemi:

1) Dispense delle lezioni di matematica superiore: corso completo / D.T. Scritto – 4a ed. – M.: Iris-press, 2006
2) Analisi di regressione applicata / N. Draper, G. Smith - 2a ed. – M.: Finanza e Statistica, 1986 (traduzione dall'inglese)
3) Problemi per la risoluzione di equazioni di matrici:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Fonte: habr.com

Aggiungi un commento