Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Straipsnio tikslas – padėti pradedantiesiems duomenų mokslininkams. IN ankstesnis straipsnis Mes apibūdinome tris linijinės regresijos lygties sprendimo būdus: analitinį sprendimą, gradiento nusileidimą, stochastinį gradiento nusileidimą. Tada analitiniam sprendimui pritaikėme formulę Tiesinės regresijos lygtį perkeliame į matricos formą. Šiame straipsnyje, kaip rodo pavadinimas, pateisinsime šios formulės naudojimą arba, kitaip tariant, patys ją išvesime.

Kodėl prasminga daugiau dėmesio skirti formulei Tiesinės regresijos lygtį perkeliame į matricos formą?

Būtent su matricine lygtimi dažniausiai pradedama susipažinti su tiesine regresija. Tuo pačiu metu detalūs skaičiavimai, kaip buvo gauta formulė, yra reti.

Pavyzdžiui, „Yandex“ mašininio mokymosi kursuose, kai studentai supažindinami su reguliavimu, jiems siūloma naudotis bibliotekos funkcijomis. sklearn, o apie matricinį algoritmo atvaizdavimą nė žodžio neužsimenama. Būtent šiuo metu kai kurie klausytojai gali norėti suprasti šią problemą išsamiau - parašyti kodą nenaudodami paruoštų funkcijų. Norėdami tai padaryti, pirmiausia turite pateikti lygtį su reguliatoriumi matricos forma. Šis straipsnis leis tiems, kurie nori įvaldyti tokius įgūdžius. Pradėkime.

Pradinės sąlygos

Tiksliniai rodikliai

Turime įvairių tikslinių verčių. Pavyzdžiui, tikslinis rodiklis gali būti bet kurio turto kaina: naftos, aukso, kviečių, dolerio ir kt. Tuo pačiu metu daugybe tikslinių rodiklių verčių turime omenyje stebėjimų skaičių. Tokie stebėjimai galėtų būti, pavyzdžiui, mėnesinės naftos kainos metams, tai yra, turėsime 12 tikslinių verčių. Pradėkime supažindinti su užrašu. Kiekvieną tikslinio rodiklio reikšmę pažymėkime kaip Tiesinės regresijos lygtį perkeliame į matricos formą. Iš viso turime Tiesinės regresijos lygtį perkeliame į matricos formą stebėjimai, o tai reiškia, kad galime vaizduoti savo stebėjimus kaip Tiesinės regresijos lygtį perkeliame į matricos formą.

Regresoriai

Darysime prielaidą, kad yra veiksnių, kurie tam tikru mastu paaiškina tikslinio rodiklio reikšmes. Pavyzdžiui, dolerio/rublio kursą stipriai veikia naftos kaina, Federalinio rezervo kursas ir kt. Tokie veiksniai vadinami regresoriais. Tuo pačiu metu kiekviena tikslinio rodiklio reikšmė turi atitikti regresoriaus reikšmę, tai yra, jei 12 m. turime 2018 tikslinių rodiklių kiekvienam mėnesiui, tai taip pat turėtume turėti 12 regresoriaus verčių tam pačiam laikotarpiui. Pažymime kiekvieno regresoriaus reikšmes Tiesinės regresijos lygtį perkeliame į matricos formą. Tegul mūsų atveju taip yra Tiesinės regresijos lygtį perkeliame į matricos formą regresoriai (t. y. Tiesinės regresijos lygtį perkeliame į matricos formą veiksnius, turinčius įtakos tikslinių rodiklių reikšmėms). Tai reiškia, kad mūsų regresorius galima pateikti taip: 1-ajam regresoriui (pavyzdžiui, naftos kainai): Tiesinės regresijos lygtį perkeliame į matricos formą, 2-ajam regresoriui (pavyzdžiui, Fed norma): Tiesinės regresijos lygtį perkeliame į matricos formą, Dėl "Tiesinės regresijos lygtį perkeliame į matricos formą-th" regresorius: Tiesinės regresijos lygtį perkeliame į matricos formą

Tikslinių rodiklių priklausomybė nuo regresorių

Tarkime, kad tikslinio rodiklio priklausomybė Tiesinės regresijos lygtį perkeliame į matricos formą nuo regresorių"Tiesinės regresijos lygtį perkeliame į matricos formąth" stebėjimas gali būti išreikštas tiesinės regresijos lygtimi, kurios forma:

Tiesinės regresijos lygtį perkeliame į matricos formą

Kur Tiesinės regresijos lygtį perkeliame į matricos formą - "Tiesinės regresijos lygtį perkeliame į matricos formą-th" regresoriaus reikšmė nuo 1 iki Tiesinės regresijos lygtį perkeliame į matricos formą,

Tiesinės regresijos lygtį perkeliame į matricos formą — regresorių skaičius nuo 1 iki Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą — kampiniai koeficientai, kurie parodo, kiek vidutiniškai pasikeis apskaičiuotas tikslinis rodiklis, pasikeitus regresoriui.

Kitaip tariant, mes esame už visus (išskyrus Tiesinės regresijos lygtį perkeliame į matricos formą) regresoriaus nustatome „mūsų“ koeficientą Tiesinės regresijos lygtį perkeliame į matricos formą, tada padauginkite koeficientus iš regresorių verčių "Tiesinės regresijos lygtį perkeliame į matricos formąth" stebėjimas, kaip rezultatas, mes gauname tam tikrą aproksimaciją "Tiesinės regresijos lygtį perkeliame į matricos formą-tasis“ tikslinis rodiklis.

Todėl turime pasirinkti tokius koeficientus Tiesinės regresijos lygtį perkeliame į matricos formą, kurioje mūsų apytikslės funkcijos reikšmės Tiesinės regresijos lygtį perkeliame į matricos formą bus išdėstyti kuo arčiau tikslinių rodiklių verčių.

Aproksimacinės funkcijos kokybės įvertinimas

Aproksimacinės funkcijos kokybės vertinimą nustatysime mažiausių kvadratų metodu. Kokybės vertinimo funkcija šiuo atveju bus tokia:

Tiesinės regresijos lygtį perkeliame į matricos formą

Turime pasirinkti tokias koeficientų $w reikšmes, kurių vertė yra Tiesinės regresijos lygtį perkeliame į matricos formą bus mažiausias.

Lygties pavertimas matricine forma

Vektorinis vaizdavimas

Pirmiausia, norėdami palengvinti savo gyvenimą, turėtumėte atkreipti dėmesį į tiesinės regresijos lygtį ir pastebėti, kad pirmasis koeficientas Tiesinės regresijos lygtį perkeliame į matricos formą nėra dauginamas iš jokio regresoriaus. Tuo pačiu metu, kai duomenis konvertuosime į matricinę formą, aukščiau paminėta aplinkybė labai apsunkins skaičiavimus. Šiuo atžvilgiu siūloma įvesti dar vieną regresorių pirmajam koeficientui Tiesinės regresijos lygtį perkeliame į matricos formą ir prilygink vienam. Arba tiksliau, kiekvienas "Tiesinės regresijos lygtį perkeliame į matricos formąšio regresoriaus reikšmę prilygink vienetui - juk padauginus iš vieneto, skaičiavimų rezultato požiūriu niekas nepasikeis, bet matricų sandaugos taisyklių požiūriu mūsų kankinimas bus gerokai sumažintas.

Šiuo metu, norėdami supaprastinti medžiagą, tarkime, kad turime tik vieną "Tiesinės regresijos lygtį perkeliame į matricos formą-tas“ pastebėjimas. Tada įsivaizduokite regresorių vertes "Tiesinės regresijos lygtį perkeliame į matricos formą-th“ stebėjimai kaip vektorius Tiesinės regresijos lygtį perkeliame į matricos formą. Vektorius Tiesinės regresijos lygtį perkeliame į matricos formą turi dimensiją Tiesinės regresijos lygtį perkeliame į matricos formąTai reiškia, kad Tiesinės regresijos lygtį perkeliame į matricos formą eilutės ir 1 stulpelis:

Tiesinės regresijos lygtį perkeliame į matricos formą

Reikalingus koeficientus pavaizduokime kaip vektorių Tiesinės regresijos lygtį perkeliame į matricos formą, turintis matmenis Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtis, skirta "Tiesinės regresijos lygtį perkeliame į matricos formą-th“ stebėjimas bus toks:

Tiesinės regresijos lygtį perkeliame į matricos formą

Linijinio modelio kokybės įvertinimo funkcija bus tokia:

Tiesinės regresijos lygtį perkeliame į matricos formą

Atkreipkite dėmesį, kad pagal matricos daugybos taisykles mums reikėjo perkelti vektorių Tiesinės regresijos lygtį perkeliame į matricos formą.

Matricinis vaizdavimas

Padauginę vektorius gauname skaičių: Tiesinės regresijos lygtį perkeliame į matricos formą, ko ir reikia tikėtis. Šis skaičius yra apytikslis "Tiesinės regresijos lygtį perkeliame į matricos formą-tasis“ tikslinis rodiklis. Tačiau mums reikia apytikslės ne vienos tikslinės vertės, bet visų jų. Norėdami tai padaryti, užsirašykite viską "Tiesinės regresijos lygtį perkeliame į matricos formą-th" regresorius matricos formatu Tiesinės regresijos lygtį perkeliame į matricos formą. Gauta matrica turi matmenis Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Dabar tiesinės regresijos lygtis bus tokia:

Tiesinės regresijos lygtį perkeliame į matricos formą

Pažymime tikslinių rodiklių reikšmes (visi Tiesinės regresijos lygtį perkeliame į matricos formą) vienam vektoriui Tiesinės regresijos lygtį perkeliame į matricos formą matmuo Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Dabar galime parašyti lygtį, skirtą tiesinio modelio kokybei įvertinti matricos formatu:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesą sakant, iš šios formulės toliau gauname mums žinomą formulę Tiesinės regresijos lygtį perkeliame į matricos formą

Kaip tai daroma? Atverčiami skliaustai, atliekama diferenciacija, transformuojamos gautos išraiškos ir t.t., kaip tik tai ir padarysime dabar.

Matricos transformacijos

Atidarykime skliaustus

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Paruoškime diferencijavimo lygtį

Norėdami tai padaryti, atliksime keletą transformacijų. Vėlesniuose skaičiavimuose mums bus patogiau, jei vektorius Tiesinės regresijos lygtį perkeliame į matricos formą bus pavaizduoti kiekvieno lygties produkto pradžioje.

Konversija 1

Tiesinės regresijos lygtį perkeliame į matricos formą

Kaip tai nutiko? Norėdami atsakyti į šį klausimą, tiesiog pažiūrėkite į dauginamų matricų dydžius ir pamatysite, kad išvestyje gauname skaičių arba kitaip Tiesinės regresijos lygtį perkeliame į matricos formą.

Užsirašykime matricinių išraiškų dydžius.

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Konversija 2

Tiesinės regresijos lygtį perkeliame į matricos formą

Parašykime tai panašiai kaip 1 transformaciją

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Išvestyje gauname lygtį, kurią turime atskirti:
Tiesinės regresijos lygtį perkeliame į matricos formą

Atskiriame modelio kokybės vertinimo funkciją

Atskirkime vektoriaus atžvilgiu Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Klausimai kodėl Tiesinės regresijos lygtį perkeliame į matricos formą neturėtų būti, bet plačiau panagrinėsime išvestinių nustatymo operacijas kitose dviejose išraiškose.

1 diferenciacija

Išplėskime skirtumą: Tiesinės regresijos lygtį perkeliame į matricos formą

Norint nustatyti matricos ar vektoriaus išvestinę, reikia pažvelgti į tai, kas yra jų viduje. Pažiūrėkime:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą Tiesinės regresijos lygtį perkeliame į matricos formą

Pažymime matricų sandaugą Tiesinės regresijos lygtį perkeliame į matricos formą per matricą Tiesinės regresijos lygtį perkeliame į matricos formą. Matrica Tiesinės regresijos lygtį perkeliame į matricos formą kvadratas, be to, jis yra simetriškas. Šios savybės mums pravers vėliau, prisiminkime jas. Matrica Tiesinės regresijos lygtį perkeliame į matricos formą turi dimensiją Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Dabar mūsų užduotis yra teisingai padauginti vektorius iš matricos ir negauti „du kartus du yra penki“, todėl susikaupkime ir būkime ypač atsargūs.

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tačiau mes pasiekėme sudėtingą išraišką! Tiesą sakant, mes gavome skaičių – skaliarą. Ir dabar iš tikrųjų pereiname prie diferenciacijos. Kiekvienam koeficientui reikia rasti gautos išraiškos išvestinę Tiesinės regresijos lygtį perkeliame į matricos formą ir gauti dimensijos vektorių kaip išvestį Tiesinės regresijos lygtį perkeliame į matricos formą. Tik tuo atveju, surašysiu procedūras pagal veiksmą:

1) atskirti pagal Tiesinės regresijos lygtį perkeliame į matricos formą, mes gauname: Tiesinės regresijos lygtį perkeliame į matricos formą

2) atskirti pagal Tiesinės regresijos lygtį perkeliame į matricos formą, mes gauname: Tiesinės regresijos lygtį perkeliame į matricos formą

3) atskirti pagal Tiesinės regresijos lygtį perkeliame į matricos formą, mes gauname: Tiesinės regresijos lygtį perkeliame į matricos formą

Išvestis yra pažadėtas dydžio vektorius Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Jei pažvelgsite į vektorių atidžiau, pastebėsite, kad kairysis ir atitinkamas dešinysis vektoriaus elementai gali būti sugrupuoti taip, kad dėl to vektorius gali būti izoliuotas nuo pateikto vektoriaus Tiesinės regresijos lygtį perkeliame į matricos formą dydžio Tiesinės regresijos lygtį perkeliame į matricos formą. Pavyzdžiui, Tiesinės regresijos lygtį perkeliame į matricos formą (viršutinės vektoriaus eilutės kairysis elementas) Tiesinės regresijos lygtį perkeliame į matricos formą (dešinysis viršutinės vektoriaus eilutės elementas) gali būti pavaizduotas kaip Tiesinės regresijos lygtį perkeliame į matricos formąIr Tiesinės regresijos lygtį perkeliame į matricos formą - kaip Tiesinės regresijos lygtį perkeliame į matricos formą ir tt kiekvienoje eilutėje. Sugrupuokime:

Tiesinės regresijos lygtį perkeliame į matricos formą

Išimkime vektorių Tiesinės regresijos lygtį perkeliame į matricos formą o išvestyje gauname:

Tiesinės regresijos lygtį perkeliame į matricos formą

Dabar atidžiau pažvelkime į gautą matricą. Matrica yra dviejų matricų suma Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Prisiminkime, kad šiek tiek anksčiau pastebėjome vieną svarbią matricos savybę Tiesinės regresijos lygtį perkeliame į matricos formą - jis yra simetriškas. Remdamiesi šia savybe, galime drąsiai teigti, kad išraiška Tiesinės regresijos lygtį perkeliame į matricos formą lygus Tiesinės regresijos lygtį perkeliame į matricos formą. Tai galima nesunkiai patikrinti išplečiant matricų sandaugą po elemento Tiesinės regresijos lygtį perkeliame į matricos formą. Čia to nedarysime, norintieji gali tai patikrinti patys.

Grįžkime prie savo išraiškos. Po mūsų transformacijų pasirodė taip, kaip norėjome matyti:

Tiesinės regresijos lygtį perkeliame į matricos formą

Taigi, mes baigėme pirmąjį diferencijavimą. Pereikime prie antrosios išraiškos.

2 diferenciacija

Tiesinės regresijos lygtį perkeliame į matricos formą

Eikime numintu keliu. Jis bus daug trumpesnis nei ankstesnis, todėl nenueikite per toli nuo ekrano.

Išplėskime vektorius ir matricos elementus po elementą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Išimkime du iš skaičiavimų kuriam laikui – tai nevaidina didelio vaidmens, tada grąžinsime į savo vietą. Padauginkime vektorius iš matricos. Visų pirma, padauginkime matricą Tiesinės regresijos lygtį perkeliame į matricos formą į vektorių Tiesinės regresijos lygtį perkeliame į matricos formą, čia neturime jokių apribojimų. Gauname dydžio vektorių Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Atlikime tokį veiksmą – padauginkite vektorių Tiesinės regresijos lygtį perkeliame į matricos formą į gautą vektorių. Prie išėjimo mūsų lauks numeris:

Tiesinės regresijos lygtį perkeliame į matricos formą

Tada mes jį atskirsime. Išvestyje gauname dimensijos vektorių Tiesinės regresijos lygtį perkeliame į matricos formą:

Tiesinės regresijos lygtį perkeliame į matricos formą

Kažką primena? Teisingai! Tai yra matricos produktas Tiesinės regresijos lygtį perkeliame į matricos formą į vektorių Tiesinės regresijos lygtį perkeliame į matricos formą.

Taigi antroji diferenciacija sėkmingai baigta.

Vietoj išvados

Dabar žinome, kaip atsirado lygybė Tiesinės regresijos lygtį perkeliame į matricos formą.

Galiausiai apibūdinsime greitą pagrindinių formulių transformavimo būdą.

Įvertinkime modelio kokybę mažiausių kvadratų metodu:
Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Išskirkime gautą išraišką:
Tiesinės regresijos lygtį perkeliame į matricos formą Tiesinės regresijos lygtį perkeliame į matricos formą

Tiesinės regresijos lygtį perkeliame į matricos formą

Literatūra

Interneto šaltiniai:

1) habr.com/en/post/278513
2) habr.com/ru/company/ods/blog/322076
3) habr.com/en/post/307004
4) nabatchikov.com/blog/view/matrix_der

Vadovėliai, uždavinių rinkiniai:

1) Aukštosios matematikos paskaitų konspektas: visas kursas / D.T. Parašyta – 4-asis leidimas. – M.: Iris-press, 2006 m
2) Taikomoji regresinė analizė / N. Draper, G. Smith - 2nd ed. – M.: Finansai ir statistika, 1986 (vertimas iš anglų kalbos)
3) Matricinių lygčių sprendimo uždaviniai:
function-x.ru/matrix_equations.html
mathprofi.ru/deistviya_s_matricami.html


Šaltinis: www.habr.com

Добавить комментарий