Tujuan tina artikel nyaéta pikeun nyayogikeun pangrojong pikeun élmuwan data awal. DI
Naha asup akal pikeun nengetan tambahan kana rumus ?
Kalayan persamaan matriks, dina kalolobaan kasus, anjeun mimiti kenal sareng régrési linier. Dina waktu nu sarua, itungan lengkep ngeunaan kumaha rumus ieu diturunkeun jarang.
Contona, dina kursus machine learning ti Yandex, nalika siswa diwanohkeun kana regularization, aranjeunna ditawarkeun ngagunakeun fungsi ti perpustakaan. sklearn, Bari teu kecap disebutkeun ngeunaan ngagambarkeun matrix tina algoritma. Dina momen ieu sababaraha listeners meureun hoyong ngartos masalah ieu dina leuwih jéntré - nulis kode tanpa ngagunakeun fungsi siap-dijieun. Sareng pikeun ngalakukeun ieu, anjeun kedah nampilkeun persamaan sareng regularizer dina bentuk matriks. Artikel ieu bakal ngidinan jalma anu hayang ngawasaan kaahlian sapertos. Hayu urang ngamimitian.
Kaayaan awal
Indikator sasaran
Urang boga sauntuyan nilai target. Salaku conto, indikator target tiasa janten harga aset naon waé: minyak, emas, gandum, dolar, jsb. Dina waktos anu sami, ku sababaraha nilai indikator target kami hartosna jumlah observasi. observasi misalna bisa jadi, contona, harga minyak bulanan keur sataun, nyaeta, urang bakal boga 12 nilai target. Hayu urang mimitian ngawanohkeun notasi. Hayu urang denote unggal nilai indikator target salaku . Dina total kami boga observasi, nu hartina urang bisa ngagambarkeun observasi urang salaku .
Regressors
Urang bakal nganggap yén aya faktor anu ka extent tangtu ngajelaskeun nilai indikator target. Contona, kurs dollar / ruble kuat dipangaruhan ku harga minyak, laju Reserve Federal, jsb faktor sapertos disebut regressors. Dina waktos anu sami, unggal nilai indikator target kedah pakait sareng nilai regressor, nyaéta, upami urang gaduh 12 indikator target unggal bulan di 2018, maka urang ogé kedah gaduh 12 nilai regressor pikeun période anu sami. Hayu urang nunjukkeun nilai unggal regressor ku . Hayu bisi urang aya regressors (ie. faktor anu mangaruhan kana nilai indikator udagan). Ieu ngandung harti regressors urang bisa dibere kieu: pikeun regressor 1st (contona, harga minyak): , pikeun regressor 2nd (contona, laju Fed): , Pikeun"-th" regressor:
Gumantungna indikator target on regressors
Hayu urang nganggap yén gumantungna indikator target ti regressors"th" observasi bisa ditembongkeun ngaliwatan persamaan régrési linier tina wangun:
dimana - "-th" nilai regressor ti 1 nepi ka ,
- Jumlah regressors ti 1 ka
- koefisien sudut, nu ngagambarkeun jumlah ku nu indikator target diitung bakal robah rata-rata nalika regressor robah.
Dina basa sejen, urang keur dulur (iwal ) tina regressor urang nangtukeun koefisien "urang". , teras kalikeun koefisien ku nilai regressors "th" observasi, salaku hasilna urang meunangkeun perkiraan tangtu "-th" indikator target.
Ku alatan éta, urang kudu milih koefisien misalna , dimana nilai tina fungsi perkiraan urang bakal lokasina sacaket mungkin ka nilai indikator target.
Assessing kualitas fungsi approximating
Urang bakal nangtukeun assessment kualitas tina fungsi approximating ngagunakeun métode kuadrat sahenteuna. Fungsi penilaian kualitas dina hal ieu bakal nyandak bentuk ieu:
Urang kedah milih nilai sapertos koefisien $w$ anu nilaina bakal pangleutikna.
Ngarobah persamaan kana wangun matriks
Répréséntasi vektor
Pikeun dimimitian ku, sangkan hirup anjeun leuwih gampang, Anjeun kudu nengetan persamaan régrési linier sarta perhatikeun yén koefisien munggaran teu dikali regressor wae. Dina waktos anu sami, nalika urang ngarobih data kana bentuk matriks, kaayaan anu disebatkeun di luhur bakal ngahesekeun itungan. Dina hal ieu, eta diusulkeun pikeun ngawanohkeun regressor sejen pikeun koefisien munggaran jeung equate eta hiji. Atanapi langkungna, unggal"equate nilai th regressor ieu hiji - sanggeus kabeh, nalika dikali hiji, euweuh bakal robah tina sudut pandang tina hasil itungan, tapi tina sudut pandang aturan pikeun produk matrices, siksaan urang. bakal nyata ngurangan.
Ayeuna, pikeun momen, pikeun nyederhanakeun bahan, hayu urang nganggap yén urang ngan ukur gaduh hiji "-th" observasi. Lajeng, bayangkeun nilai-nilai regressors "-th" observasi salaku véktor . Véktor boga dimensi , Nyaeta baris jeung 1 kolom:
Hayu urang ngagambarkeun koefisien diperlukeun salaku vektor , ngabogaan dimensi :
Persamaan régrési linier pikeun "-th" observasi bakal nyandak bentuk:
Fungsi pikeun meunteun kualitas model linier bakal nyandak bentuk:
Perhatikeun yén luyu jeung aturan multiplication matrix, urang diperlukeun pikeun transpose vektor .
Répréséntasi matriks
Salaku hasil tina ngalikeun vektor, urang meunang angka: , anu dipiharep. Angka ieu mangrupikeun perkiraan "-th" indikator target. Tapi urang peryogi perkiraan henteu ngan ukur hiji nilai target, tapi sadayana. Jang ngalampahkeun ieu, hayu urang nyerat sadayana ""th" regressors dina format matrix . Matriks anu dihasilkeun gaduh diménsi :
Ayeuna persamaan régrési linier bakal nyandak bentuk:
Hayu urang nunjukkeun nilai indikator target (sadayana ) per vektor dimensi :
Ayeuna urang tiasa nyerat persamaan pikeun meunteun kualitas model linier dina format matriks:
Sabenerna, tina rumus ieu urang salajengna meunangkeun rumus dipikawanoh ku urang
Kumaha eta rengse? Kurung dibuka, diferensiasi dilaksanakeun, éksprési anu hasilna dirobih, sareng sajabana, sareng ieu anu bakal urang laksanakeun ayeuna.
Transformasi matrix
Hayu urang buka kurung
Hayu urang nyiapkeun persamaan pikeun diferensiasi
Jang ngalampahkeun ieu, urang bakal ngalakukeun sababaraha transformasi. Dina itungan saterusna bakal leuwih merenah pikeun urang lamun vektor bakal digambarkeun dina awal unggal produk dina persamaan.
Konversi 1
Kumaha éta kajantenanna? Pikeun ngajawab patarosan ieu, tingali ukuran matriks anu dikalikeun sareng tingali yén dina kaluaran urang nampi nomer atanapi sanés. .
Hayu urang tuliskeun ukuran ekspresi matriks.
Konversi 2
Hayu urang nyerat dina cara anu sami sareng transformasi 1
Dina kaluaran kami nampi persamaan anu urang kedah ngabédakeun:
Urang ngabedakeun fungsi assessment kualitas modél
Hayu urang ngabedakeun ngeunaan vektor :
Patarosan naha teu kudu aya, tapi urang bakal nalungtik operasi pikeun nangtukeun turunan dina dua ekspresi sejenna dina leuwih jéntré.
Diferensiasi 1
Hayu urang ngalegaan diferensiasi:
Pikeun nangtukeun turunan matriks atanapi vektor, anjeun kedah ningali naon anu aya di jerona. Hayu urang tingali:
Hayu urang nunjukkeun produk tina matriks ngaliwatan matriks . Matriks pasagi jeung komo deui, éta simetris. Sipat ieu bakal mangpaat pikeun urang engké, hayu urang apal aranjeunna. Matriks boga dimensi :
Ayeuna tugas urang leres-leres kalikeun vektor ku matriks sareng henteu kéngingkeun "dua kali dua nyaéta lima," janten hayu urang konsentrasi sareng ati-ati pisan.
Nanging, kami parantos ngahontal ekspresi anu rumit! Nyatana, urang ngagaduhan nomer - skalar. Sareng ayeuna, nyata, urang teraskeun kana diferensiasi. Ieu diperlukeun pikeun manggihan turunan tina éksprési anu dihasilkeun pikeun tiap koefisien sareng kéngingkeun véktor dimensi salaku kaluaran . Bisi wae, kuring bakal nyerat prosedur ku tindakan:
1) ngabedakeun ku , urang meunang:
2) ngabedakeun ku , urang meunang:
3) ngabedakeun ku , urang meunang:
Kaluaran mangrupikeun vektor ukuran anu dijanjikeun :
Upami anjeun ningali vektor langkung caket, anjeun bakal perhatikeun yén elemen kénca sareng katuhu katuhu tina vektor tiasa dikelompokkeun ku cara anu, salaku hasilna, véktor tiasa diisolasi tina vektor anu dibere. ukuran na . Salaku conto (elemen kénca garis luhur vektor) (unsur katuhu garis luhur vektor nu) bisa digambarkeun salaku jeung - sakumaha jsb. dina unggal baris. Hayu urang grup:
Hayu urang kaluar vektor sareng dina kaluaran kami nampi:
Ayeuna, hayu urang ningal langkung caket kana matriks anu hasilna. Matriks nyaéta jumlah dua matriks :
Hayu urang ngelingan yén saeutik saméméhna urang nyatet hiji sipat penting matrix - éta simetris. Dumasar sipat ieu, urang confidently bisa disebutkeun yen ekspresi sarua . Ieu tiasa gampang diverifikasi ku cara ngalegaan produk matriks unsur demi unsur . Kami moal ngalakukeun ieu di dieu; anu kabetot tiasa mariksa nyalira.
Hayu urang balik deui ka ekspresi urang. Saatos transformasi urang, tétéla cara urang hayang ningali eta:
Ku kituna, urang geus réngsé diferensiasi munggaran. Hayu urang ngaléngkah ka ekspresi kadua.
Diferensiasi 2
Hayu urang tuturkeun jalan keok. Éta bakal langkung pondok tibatan anu sateuacana, janten tong jauh teuing tina layar.
Hayu urang ngalegaan vektor sareng unsur matriks ku unsur:
Hayu urang miceun dua tina itungan sakedap - éta henteu maénkeun peran anu ageung, teras urang nempatkeun deui dina tempatna. Hayu urang kalikeun vektor ku matriks. Anu mimiti, hayu urang kalikeun matrix pikeun vektor , urang teu boga larangan di dieu. Simkuring meunang ukuran vektor :
Hayu urang ngalakukeun tindakan di handap ieu - kalikeun vektor kana véktor anu dihasilkeun. Di jalan kaluar nomerna bakal ngantosan urang:
Teras urang ngabedakeunana. Dina kaluaran kami nampi vektor dimensi :
Ngingetkeun kuring ngeunaan hiji hal? Éta leres! Ieu produk tina matriks pikeun vektor .
Ku kituna, diferensiasi kadua hasil réngsé.
Gantina kacindekan
Ayeuna urang terang kumaha sasaruaan sumping .
Tungtungna, urang bakal ngajelaskeun cara gancang transformasi rumus dasar.
Hayu urang evaluate kualitas model luyu jeung métode kuadrat sahenteuna:
Hayu urang ngabedakeun ekspresi hasilna:
pustaka
Sumber Internét:
1)
2)
3)
4)
Buku ajar, kumpulan masalah:
1) Catetan kuliah ngeunaan matematika luhur: kursus lengkep / D.T. Ditulis - édisi ka-4. – M.: Iris-press, 2006
2) Analisis régrési dilarapkeun / N. Draper, G. Smith - 2nd ed. - M .: Keuangan sareng statistik, 1986 (ditarjamahkeun tina basa Inggris)
3) Masalah pikeun ngungkulan persamaan matriks:
sumber: www.habr.com