వ్యాసం యొక్క ఉద్దేశ్యం ప్రారంభ డేటా శాస్త్రవేత్తలకు మద్దతు అందించడం. IN
ఫార్ములాపై అదనపు శ్రద్ధ పెట్టడం ఎందుకు అర్ధమే ?
ఇది మాతృక సమీకరణంతో చాలా సందర్భాలలో లీనియర్ రిగ్రెషన్తో పరిచయం పొందడానికి ప్రారంభమవుతుంది. అదే సమయంలో, ఫార్ములా ఎలా ఉద్భవించింది అనేదానికి సంబంధించిన వివరణాత్మక లెక్కలు చాలా అరుదు.
ఉదాహరణకు, Yandex నుండి మెషిన్ లెర్నింగ్ కోర్సులలో, విద్యార్థులను క్రమబద్ధీకరణకు పరిచయం చేసినప్పుడు, వారు లైబ్రరీ నుండి విధులను ఉపయోగించుకునే అవకాశం ఉంది. sklearn, అల్గారిథమ్ యొక్క మాతృక ప్రాతినిధ్యం గురించి ఒక్క పదం కూడా ప్రస్తావించబడలేదు. ఈ సమయంలోనే కొంతమంది శ్రోతలు ఈ సమస్యను మరింత వివరంగా అర్థం చేసుకోవాలనుకోవచ్చు - రెడీమేడ్ ఫంక్షన్లను ఉపయోగించకుండా కోడ్ రాయండి. మరియు దీన్ని చేయడానికి, మీరు ముందుగా మాతృక రూపంలో క్రమబద్ధీకరణతో సమీకరణాన్ని ప్రదర్శించాలి. ఈ వ్యాసం అటువంటి నైపుణ్యాలను నేర్చుకోవాలనుకునే వారిని అనుమతిస్తుంది. ప్రారంభిద్దాం.
ప్రారంభ పరిస్థితులు
లక్ష్య సూచికలు
మేము లక్ష్య విలువల పరిధిని కలిగి ఉన్నాము. ఉదాహరణకు, లక్ష్య సూచిక ఏదైనా ఆస్తి యొక్క ధర కావచ్చు: చమురు, బంగారం, గోధుమలు, డాలర్ మొదలైనవి. అదే సమయంలో, అనేక లక్ష్య సూచిక విలువల ద్వారా మేము పరిశీలనల సంఖ్యను సూచిస్తాము. అటువంటి పరిశీలనలు, ఉదాహరణకు, సంవత్సరానికి నెలవారీ చమురు ధరలు కావచ్చు, అంటే, మనకు 12 లక్ష్య విలువలు ఉంటాయి. సంజ్ఞామానాన్ని పరిచయం చేయడం ప్రారంభిద్దాం. లక్ష్య సూచిక యొక్క ప్రతి విలువను ఇలా సూచిస్తాము . మొత్తంగా మన దగ్గర ఉంది పరిశీలనలు, అంటే మన పరిశీలనలను ఇలా సూచించవచ్చు .
తిరోగమనకారులు
లక్ష్య సూచిక యొక్క విలువలను కొంతవరకు వివరించే కారకాలు ఉన్నాయని మేము అనుకుంటాము. ఉదాహరణకు, డాలర్/రూబుల్ మారకపు రేటు చమురు ధర, ఫెడరల్ రిజర్వ్ రేటు మొదలైన వాటి ద్వారా బలంగా ప్రభావితమవుతుంది. అటువంటి కారకాలను రిగ్రెసర్స్ అంటారు. అదే సమయంలో, ప్రతి లక్ష్య సూచిక విలువ తప్పనిసరిగా రిగ్రెసర్ విలువకు అనుగుణంగా ఉండాలి, అంటే, 12లో ప్రతి నెలా మనకు 2018 లక్ష్య సూచికలు ఉంటే, అదే కాలానికి మనం 12 రిగ్రెసర్ విలువలను కలిగి ఉండాలి. ప్రతి రిగ్రెసర్ యొక్క విలువలను దీని ద్వారా సూచిస్తాము . మన విషయంలో ఉండనివ్వండి రిగ్రెసర్లు (అనగా లక్ష్య సూచిక విలువలను ప్రభావితం చేసే అంశాలు). దీని అర్థం మా రిగ్రెసర్లను ఈ క్రింది విధంగా ప్రదర్శించవచ్చు: 1వ రిగ్రెసర్ కోసం (ఉదాహరణకు, చమురు ధర): , 2వ రిగ్రెసర్ కోసం (ఉదాహరణకు, ఫెడ్ రేటు): , కోసం "-వ" రిగ్రెసర్:
రిగ్రెసర్లపై లక్ష్య సూచికల ఆధారపడటం
లక్ష్య సూచిక యొక్క ఆధారపడటం అని అనుకుందాం రిగ్రెసర్ల నుండి "th" పరిశీలన రూపం యొక్క సరళ రిగ్రెషన్ సమీకరణం ద్వారా వ్యక్తీకరించబడుతుంది:
పేరు - "-వ" రిగ్రెసర్ విలువ 1 నుండి ,
- 1 నుండి రిగ్రెసర్ల సంఖ్య
— కోణీయ గుణకాలు, రిగ్రెసర్ మారినప్పుడు లెక్కించిన లక్ష్య సూచిక సగటున మారే మొత్తాన్ని సూచిస్తుంది.
మరో మాటలో చెప్పాలంటే, మేము అందరి కోసం ఉన్నాము (తప్ప ) రిగ్రెసర్ యొక్క మేము "మా" గుణకాన్ని నిర్ణయిస్తాము , ఆపై గుణకాలను రిగ్రెసర్ల విలువలతో గుణించండి "th" పరిశీలన, ఫలితంగా మేము ఒక నిర్దిష్ట ఉజ్జాయింపును పొందుతాము "-వ" లక్ష్య సూచిక.
అందువల్ల, మేము అటువంటి కోఎఫీషియంట్లను ఎంచుకోవాలి , దీనిలో మా ఉజ్జాయింపు ఫంక్షన్ విలువలు లక్ష్య సూచిక విలువలకు వీలైనంత దగ్గరగా ఉంటుంది.
ఉజ్జాయింపు ఫంక్షన్ యొక్క నాణ్యతను అంచనా వేయడం
మేము కనీసం చతురస్రాల పద్ధతిని ఉపయోగించి ఉజ్జాయింపు ఫంక్షన్ యొక్క నాణ్యత అంచనాను నిర్ణయిస్తాము. ఈ సందర్భంలో నాణ్యత అంచనా ఫంక్షన్ క్రింది రూపాన్ని తీసుకుంటుంది:
మేము విలువ కోసం $w$ గుణకాల యొక్క అటువంటి విలువలను ఎంచుకోవాలి చిన్నదిగా ఉంటుంది.
సమీకరణాన్ని మాతృక రూపంలోకి మార్చడం
వెక్టర్ ప్రాతినిధ్యం
ప్రారంభించడానికి, మీ జీవితాన్ని సులభతరం చేయడానికి, మీరు లీనియర్ రిగ్రెషన్ సమీకరణానికి శ్రద్ధ వహించాలి మరియు మొదటి గుణకం గమనించాలి ఏ రిగ్రెసర్ ద్వారా గుణించబడదు. అదే సమయంలో, మేము డేటాను మ్యాట్రిక్స్ రూపంలోకి మార్చినప్పుడు, పైన పేర్కొన్న పరిస్థితి గణనలను తీవ్రంగా క్లిష్టతరం చేస్తుంది. ఈ విషయంలో, మొదటి కోఎఫీషియంట్ కోసం మరొక రిగ్రెసర్ను పరిచయం చేయడానికి ప్రతిపాదించబడింది మరియు దానిని ఒకదానితో సమానం చేయండి. లేదా బదులుగా, ప్రతి "ఈ రిగ్రెసర్ యొక్క వ విలువను ఒకదానికి సమానం చేయండి - అన్నింటికంటే, ఒకదానితో గుణించినప్పుడు, గణనల ఫలితం యొక్క కోణం నుండి ఏమీ మారదు, కానీ మాత్రికల ఉత్పత్తికి సంబంధించిన నియమాల కోణం నుండి, మా హింస గణనీయంగా తగ్గుతుంది.
ఇప్పుడు, ప్రస్తుతానికి, పదార్థాన్ని సరళీకృతం చేయడానికి, మనకు ఒకటి మాత్రమే ఉందని అనుకుందాం "-వ" పరిశీలన. అప్పుడు, రిగ్రెసర్ల విలువలను ఊహించండి "వెక్టర్గా -వ" పరిశీలనలు . వెక్టర్ కోణాన్ని కలిగి ఉంది , అంటే అడ్డు వరుసలు మరియు 1 నిలువు వరుస:
వెక్టర్గా అవసరమైన కోఎఫీషియంట్లను సూచిస్తాం , పరిమాణం కలిగి :
" కోసం లీనియర్ రిగ్రెషన్ సమీకరణం-వ" పరిశీలన రూపాన్ని తీసుకుంటుంది:
లీనియర్ మోడల్ నాణ్యతను అంచనా వేసే ఫంక్షన్ ఈ రూపాన్ని తీసుకుంటుంది:
మాతృక గుణకారం యొక్క నియమాలకు అనుగుణంగా, మేము వెక్టర్ను బదిలీ చేయవలసి ఉందని దయచేసి గమనించండి .
మాతృక ప్రాతినిధ్యం
వెక్టర్స్ గుణించడం ఫలితంగా, మేము సంఖ్యను పొందుతాము: , ఇది ఊహించదగినది. ఈ సంఖ్య ఉజ్జాయింపు "-వ" లక్ష్య సూచిక. కానీ మనకు ఒక లక్ష్య విలువ మాత్రమే కాదు, వాటన్నింటికీ ఉజ్జాయింపు అవసరం. దీన్ని చేయడానికి, ప్రతిదీ వ్రాస్దాం "-వ" మాతృక ఆకృతిలో రిగ్రెసర్లు . ఫలిత మాతృక పరిమాణం కలిగి ఉంటుంది :
ఇప్పుడు లీనియర్ రిగ్రెషన్ సమీకరణం రూపం తీసుకుంటుంది:
లక్ష్య సూచికల విలువలను సూచిస్తాము (అన్నీ ) ప్రతి వెక్టర్ పరిమాణం :
ఇప్పుడు మనం మ్యాట్రిక్స్ ఆకృతిలో లీనియర్ మోడల్ నాణ్యతను అంచనా వేయడానికి సమీకరణాన్ని వ్రాయవచ్చు:
వాస్తవానికి, ఈ ఫార్ములా నుండి మనకు తెలిసిన సూత్రాన్ని మనం మరింత పొందుతాము
ఇది ఎలా జరిగింది? బ్రాకెట్లు తెరవబడ్డాయి, భేదం నిర్వహించబడుతుంది, ఫలిత వ్యక్తీకరణలు రూపాంతరం చెందుతాయి, మొదలైనవి, మరియు ఇప్పుడు మనం చేసేది ఇదే.
మాతృక రూపాంతరాలు
బ్రాకెట్లను తెరుద్దాం
భేదం కోసం సమీకరణాన్ని సిద్ధం చేద్దాం
దీన్ని చేయడానికి, మేము కొన్ని పరివర్తనలను నిర్వహిస్తాము. తదుపరి గణనలలో వెక్టర్ అయితే మనకు మరింత సౌకర్యవంతంగా ఉంటుంది సమీకరణంలో ప్రతి ఉత్పత్తి ప్రారంభంలో సూచించబడుతుంది.
మార్పిడి 1
అది ఎలా జరిగింది? ఈ ప్రశ్నకు సమాధానమివ్వడానికి, గుణించబడుతున్న మాత్రికల పరిమాణాలను చూడండి మరియు అవుట్పుట్ వద్ద మనకు ఒక సంఖ్య లభిస్తుందో లేదో చూడండి .
మాతృక వ్యక్తీకరణల పరిమాణాలను వ్రాస్దాం.
మార్పిడి 2
పరివర్తన 1 మాదిరిగానే దీన్ని వ్రాస్దాం
అవుట్పుట్ వద్ద మనం వేరు చేయవలసిన సమీకరణాన్ని పొందుతాము:
మేము మోడల్ నాణ్యత అంచనా ఫంక్షన్ను వేరు చేస్తాము
వెక్టర్కు సంబంధించి భేదం చేద్దాం :
ఎందుకు అనే ప్రశ్నలు ఉండకూడదు, కానీ మేము ఇతర రెండు వ్యక్తీకరణలలో ఉత్పన్నాలను నిర్ణయించే కార్యకలాపాలను మరింత వివరంగా విశ్లేషిస్తాము.
భేదం 1
భేదాన్ని విస్తరింపజేద్దాం:
మాతృక లేదా వెక్టార్ యొక్క ఉత్పన్నాన్ని నిర్ణయించడానికి, మీరు వాటి లోపల ఏమి ఉందో చూడాలి. చూద్దాం:
మాత్రికల ఉత్పత్తిని సూచిస్తాము మాతృక ద్వారా . మాతృక చదరపు మరియు అంతేకాకుండా, ఇది సుష్టంగా ఉంటుంది. ఈ లక్షణాలు మనకు తరువాత ఉపయోగకరంగా ఉంటాయి, వాటిని గుర్తుంచుకోండి. మాతృక కోణాన్ని కలిగి ఉంది :
ఇప్పుడు మా పని మాతృక ద్వారా వెక్టర్లను సరిగ్గా గుణించడం మరియు "రెండుసార్లు రెండు ఐదు" పొందడం కాదు, కాబట్టి మనం ఏకాగ్రతతో మరియు చాలా జాగ్రత్తగా ఉండండి.
అయితే, మేము ఒక క్లిష్టమైన వ్యక్తీకరణను సాధించాము! నిజానికి, మాకు ఒక సంఖ్య వచ్చింది - స్కేలార్. మరియు ఇప్పుడు, వాస్తవానికి, మేము భేదానికి వెళ్తాము. ప్రతి గుణకం కోసం ఫలిత వ్యక్తీకరణ యొక్క ఉత్పన్నాన్ని కనుగొనడం అవసరం మరియు డైమెన్షన్ వెక్టర్ను అవుట్పుట్గా పొందండి . ఒకవేళ, నేను చర్య ద్వారా విధానాలను వ్రాస్తాను:
1) ద్వారా వేరు చేయండి , మాకు దొరికింది:
2) ద్వారా వేరు చేయండి , మాకు దొరికింది:
3) ద్వారా వేరు చేయండి , మాకు దొరికింది:
అవుట్పుట్ పరిమాణం యొక్క వాగ్దానం చేయబడిన వెక్టర్ :
మీరు వెక్టర్ను మరింత నిశితంగా పరిశీలిస్తే, వెక్టర్ యొక్క ఎడమ మరియు సంబంధిత కుడి మూలకాలను సమూహపరచవచ్చని మీరు గమనించవచ్చు, ఫలితంగా, అందించిన వెక్టర్ నుండి వెక్టర్ వేరుచేయబడుతుంది. పరిమాణం . ఉదాహరణకు (వెక్టార్ ఎగువ రేఖ యొక్క ఎడమ మూలకం) (వెక్టార్ యొక్క టాప్ లైన్ యొక్క కుడి మూలకం) ఇలా సూచించవచ్చు మరియు - గా మొదలైనవి ప్రతి పంక్తిలో. సమూహం చేద్దాం:
వెక్టార్ని తీసుకుందాం మరియు అవుట్పుట్ వద్ద మనకు లభిస్తుంది:
ఇప్పుడు, ఫలిత మాతృకను నిశితంగా పరిశీలిద్దాం. మాతృక అనేది రెండు మాత్రికల మొత్తం :
మాతృక యొక్క ఒక ముఖ్యమైన ఆస్తిని మనం కొంచెం ముందుగా గుర్తించాము - ఇది సుష్టంగా ఉంటుంది. ఈ ఆస్తి ఆధారంగా, వ్యక్తీకరణ అని మేము నమ్మకంగా చెప్పగలము సమానం . మూలకం ద్వారా మాత్రికల మూలకం యొక్క ఉత్పత్తిని విస్తరించడం ద్వారా దీన్ని సులభంగా ధృవీకరించవచ్చు . మేము దీన్ని ఇక్కడ చేయము; ఆసక్తి ఉన్నవారు దీనిని స్వయంగా తనిఖీ చేయవచ్చు.
మన వ్యక్తీకరణకు తిరిగి వద్దాం. మా పరివర్తనల తర్వాత, అది మనం చూడాలనుకున్న విధంగా మారింది:
కాబట్టి, మేము మొదటి భేదాన్ని పూర్తి చేసాము. రెండవ వ్యక్తీకరణకు వెళ్దాం.
భేదం 2
కొట్టిన బాటలో నడుద్దాం. ఇది మునుపటి కంటే చాలా తక్కువగా ఉంటుంది, కాబట్టి స్క్రీన్ నుండి చాలా దూరం వెళ్లవద్దు.
మూలకం ద్వారా వెక్టర్స్ మరియు మ్యాట్రిక్స్ మూలకాన్ని విస్తరింపజేద్దాం:
కాసేపటికి రెండింటిని లెక్కల నుండి తీసివేద్దాం - ఇది పెద్ద పాత్ర పోషించదు, అప్పుడు మేము దానిని తిరిగి దాని స్థానంలో ఉంచుతాము. మాతృక ద్వారా వెక్టర్లను గుణిద్దాం. అన్నింటిలో మొదటిది, మాతృకను గుణిద్దాం వెక్టర్ కు , మాకు ఇక్కడ ఎలాంటి పరిమితులు లేవు. మేము పరిమాణం వెక్టర్ పొందుతాము :
కింది చర్యను చేద్దాం - వెక్టర్ను గుణించండి ఫలిత వెక్టర్కు. నిష్క్రమణ వద్ద నంబర్ మా కోసం వేచి ఉంటుంది:
అప్పుడు మేము దానిని వేరు చేస్తాము. అవుట్పుట్ వద్ద మనకు వెక్టర్ ఆఫ్ డైమెన్షన్ వస్తుంది :
నాకు ఏదో గుర్తుచేస్తుందా? నిజమే! ఇది మాతృక యొక్క ఉత్పత్తి వెక్టర్ కు .
అందువలన, రెండవ భేదం విజయవంతంగా పూర్తయింది.
ముగింపుకు బదులుగా
సమానత్వం ఎలా వచ్చిందో ఇప్పుడు మనకు తెలుసు .
చివరగా, మేము ప్రాథమిక సూత్రాలను మార్చడానికి శీఘ్ర మార్గాన్ని వివరిస్తాము.
తక్కువ చతురస్రాల పద్ధతికి అనుగుణంగా మోడల్ నాణ్యతను మూల్యాంకనం చేద్దాం:
ఫలిత వ్యక్తీకరణను వేరు చేద్దాం:
సాహిత్యం
ఇంటర్నెట్ మూలాలు:
1)
2)
3)
4)
పాఠ్యపుస్తకాలు, సమస్యల సేకరణలు:
1) ఉన్నత గణితంపై లెక్చర్ నోట్స్: పూర్తి కోర్సు / D.T. వ్రాసినది - 4వ ఎడిషన్. – M.: ఐరిస్-ప్రెస్, 2006
2) అప్లైడ్ రిగ్రెషన్ అనాలిసిస్ / N. డ్రేపర్, G. స్మిత్ - 2వ ఎడిషన్. – M.: ఫైనాన్స్ అండ్ స్టాటిస్టిక్స్, 1986 (ఇంగ్లీష్ నుండి అనువాదం)
3) మాతృక సమీకరణాలను పరిష్కరించడంలో సమస్యలు:
మూలం: www.habr.com