ምንጭ:
መስመራዊ ሪግሬሽን ከመረጃ ትንተና ጋር ለተያያዙ ብዙ ቦታዎች ከመሰረታዊ ስልተ ቀመሮች አንዱ ነው። የዚህ ምክንያቱ ግልጽ ነው. ይህ በጣም ቀላል እና ሊረዳ የሚችል ስልተ-ቀመር ነው, እሱም ለብዙ አስር, ካልሆነ በመቶዎች ለሚቆጠሩ ዓመታት በስፋት ጥቅም ላይ እንዲውል አስተዋጽኦ አድርጓል. ሃሳቡ የአንድ ተለዋዋጭ ቀጥተኛ ጥገኛ በሌሎች ተለዋዋጮች ስብስብ ላይ እንገምታለን እና ከዚያ ይህን ጥገኝነት ለመመለስ እንሞክራለን።
ነገር ግን ይህ ጽሁፍ ተግባራዊ ችግሮችን ለመፍታት መስመራዊ ሪግሬሽን ስለመጠቀም አይደለም። እዚህ ላይ የማሽን መማሪያ ሞጁሉን ስንጽፍ ያጋጠመንን መልሶ ለማግኘት የተከፋፈሉ አልጎሪዝም አተገባበር አስደሳች ገጽታዎችን እንመለከታለን።
ስለ ምን እያወራን ነው?
መስመራዊ ጥገኛን ወደነበረበት የመመለስ ተግባር ገጥሞናል። እንደ ግብዓት መረጃ፣ ራሳቸውን የቻሉ ተለዋዋጮች ስብስብ የቬክተር ስብስብ ተሰጥቷል፣ እያንዳንዱም ከጥገኛ ተለዋዋጭ እሴት ጋር የተቆራኘ ነው። ይህ ውሂብ በሁለት ማትሪክስ መልክ ሊወከል ይችላል፡-
አሁን ፣ ጥገኝነቱ ስለሚታሰብ ፣ እና እንዲሁም መስመራዊ ፣ የእኛን ግምት በማትሪክስ ምርት መልክ እንጽፋለን (ቀረጻውን ለማቃለል ፣ እዚህ እና ከዚህ በታች የእኩልታው ነፃ ቃል ከኋላው እንደተደበቀ ይታሰባል) , እና የማትሪክስ የመጨረሻው አምድ ክፍሎች አሉት፡-
የመስመራዊ እኩልታዎች ስርዓት ይመስላል ፣ አይደል? ይመስላል, ግን በአብዛኛው ለእንደዚህ ዓይነቱ የእኩልታዎች ስርዓት ምንም መፍትሄዎች አይኖሩም. የዚህ ምክንያቱ ጫጫታ ነው, እሱም በማንኛውም እውነተኛ መረጃ ውስጥ ይገኛል. ሌላው ምክንያት እንደ መስመራዊ ጥገኝነት አለመኖር ሊሆን ይችላል, ይህም በኦርጅናሎች ላይ ያልተለመዱ ተጨማሪ ተለዋዋጮችን በማስተዋወቅ ሊታገል ይችላል. የሚከተለውን ምሳሌ ተመልከት።
ምንጭ:
ይህ የአንድ ተለዋዋጭ ግንኙነት (በዘንጉ ላይ) ያለውን ግንኙነት የሚያሳይ ቀላል የመስመራዊ መመለሻ ምሳሌ ነው። ) ከሌላ ተለዋዋጭ (በአክሱ በኩል ). ከዚህ ምሳሌ ጋር የሚዛመዱ የመስመራዊ እኩልታዎች ስርዓት መፍትሄ እንዲያገኝ፣ ሁሉም ነጥቦች በትክክል በተመሳሳይ ቀጥታ መስመር ላይ መተኛት አለባቸው። ግን ያ እውነት አይደለም። ነገር ግን በጩኸት (ወይንም የመስመራዊ ግንኙነት ግምት የተሳሳተ ስለነበር) በተመሳሳይ ቀጥተኛ መስመር ላይ አይዋሹም. ስለዚህ, ከትክክለኛው መረጃ ላይ ቀጥተኛ ግንኙነትን ለመመለስ, ብዙውን ጊዜ አንድ ተጨማሪ ግምትን ማስተዋወቅ አስፈላጊ ነው-የግብአት መረጃው ጫጫታ ይይዛል እና ይህ ድምጽ አለው.
ከፍተኛው የዕድል ዘዴ
ስለዚህ፣ በዘፈቀደ የተከፋፈለ ጫጫታ መኖሩን ገምተናል። በእንደዚህ ዓይነት ሁኔታ ውስጥ ምን መደረግ አለበት? ለዚህ ጉዳይ በሂሳብ ውስጥ አለ እና በሰፊው ጥቅም ላይ ይውላል
ከተለመደው ጫጫታ ጋር ከውሂብ ወደ መስመራዊ ግንኙነት ወደነበረበት እንመለሳለን። የታሰበው የመስመር ግንኙነት የሂሳብ መጠበቅ መሆኑን ልብ ይበሉ አሁን ያለው መደበኛ ስርጭት. በተመሳሳይ ጊዜ, የመሆን እድሉ ታዛቢዎች መኖራቸውን ተከትሎ አንድ ወይም ሌላ እሴት ይወስዳል , እንደሚከተለው:
አሁን በምትኩ እንተኩ и የምንፈልጋቸው ተለዋዋጮች፡-
የሚቀረው ቬክተሩን መፈለግ ብቻ ነው , በዚህ ላይ ይህ ዕድል ከፍተኛ ነው. እንዲህ ዓይነቱን ተግባር ከፍ ለማድረግ በመጀመሪያ እሱን ሎጋሪዝም ለመውሰድ ምቹ ነው (የሥራው ሎጋሪዝም ከተግባሩ ጋር በተመሳሳይ ነጥብ ላይ ይደርሳል)
የትኛው፣ በተራው፣ የሚከተለውን ተግባር ለመቀነስ ይወርዳል።
በነገራችን ላይ ይህ ዘዴ ይባላል
QR መበስበስ
ከላይ የተጠቀሰው ተግባር ዝቅተኛው የዚህ ተግባር ቅልመት ዜሮ የሆነበትን ነጥብ በማግኘት ሊገኝ ይችላል። እና ቅልጥፍናው እንደሚከተለው ይጻፋል፡-
ስለዚህ ማትሪክስ እናበስባለን ወደ ማትሪክስ и እና ተከታታይ ለውጦችን ያከናውኑ (የQR መበስበስ ስልተ ቀመር ራሱ እዚህ ላይ አይታሰብም ፣ ከተያዘው ተግባር ጋር በተያያዘ አጠቃቀሙ ብቻ)
ማትሪክስ orthogonal ነው. ይህ ስራውን ለማስወገድ ያስችለናል :
እና ከተተካ ላይ , ከዚያም ይሠራል . ያንን ግምት ውስጥ በማስገባት የላይኛው የሶስት ማዕዘን ማትሪክስ ነው፣ ይህን ይመስላል
ይህ የመተካት ዘዴን በመጠቀም ሊፈታ ይችላል. ንጥረ ነገር እንደ ይገኛል , የቀድሞ አባል እንደ ይገኛል እና የመሳሰሉት.
በ QR መበስበስ አጠቃቀም ምክንያት የተገኘው የአልጎሪዝም ውስብስብነት እዚህ ጋር እኩል መሆኑን ልብ ሊባል ይገባል . ከዚህም በላይ የማትሪክስ ማባዛት ክዋኔው በጥሩ ሁኔታ ትይዩ ቢሆንም, የዚህ ስልተ ቀመር ውጤታማ የሆነ የተከፋፈለ ስሪት መጻፍ አይቻልም.
ቀስ በቀስ መውረድ
አንድን ተግባር ስለማሳነስ ሲናገሩ ሁልጊዜም (ስቶካስቲክ) ቀስ በቀስ የመውረድ ዘዴን ማስታወስ ጠቃሚ ነው። ይህ የአንድን ተግባር ቅልመት በአንድ ነጥብ ላይ ደጋግሞ በማስላት እና ከዚያም ወደ ቅልመት ተቃራኒ አቅጣጫ በማዞር ላይ የተመሰረተ ቀላል እና ውጤታማ የማሳነስ ዘዴ ነው። እያንዳንዱ እንደዚህ አይነት እርምጃ መፍትሄውን ወደ ዝቅተኛው ቅርብ ያደርገዋል. ቅልጥፍናው አሁንም ተመሳሳይ ይመስላል፡-
ይህ ዘዴ በጥሩ ሁኔታ ትይዩ እና የተከፋፈለው በግራዲየንት ኦፕሬተር መስመራዊ ባህሪያት ምክንያት ነው። ከላይ ባለው ቀመር ውስጥ በድምር ምልክት ስር ገለልተኛ ቃላት እንዳሉ ልብ ይበሉ. በሌላ አነጋገር፣ ለሁሉም ኢንዴክሶች ቅልመትን ለብቻው ማስላት እንችላለን ከመጀመሪያው እስከ , ከዚህ ጋር በትይዩ, ለ ኢንዴክሶች ቅልመትን ያሰሉ ወደ . ከዚያ የተገኙትን ቀስቶች ይጨምሩ. የመደመር ውጤቱ ልክ ከመጀመሪያው እስከ ኢንዴክሶች ቅልመትን ካሰላነው ጋር ተመሳሳይ ይሆናል። . ስለዚህ ፣ ውሂቡ በበርካታ የውሂብ ቁርጥራጮች መካከል ከተሰራጨ ፣ ቅልጥፍናው በእያንዳንዱ ቁራጭ ላይ በተናጥል ሊሰላ ይችላል ፣ እና የመጨረሻውን ውጤት ለማግኘት የእነዚህ ስሌቶች ውጤቶች ሊጠቃለሉ ይችላሉ-
ከአተገባበር አንፃር ይህ ከምሳሌው ጋር ይጣጣማል
በMapReduce ፓራዳይም ውስጥ የመተግበር ቀላልነት እና የማስፈጸም ችሎታ ቢሆንም፣ ቀስ በቀስ መውረድም የራሱ ድክመቶች አሉት። በተለይም ከሌሎቹ የበለጠ ልዩ ዘዴዎች ጋር ሲነፃፀሩ ውህደትን ለማግኘት የሚያስፈልጉት የእርምጃዎች ብዛት በከፍተኛ ደረጃ ከፍ ያለ ነው።
LSQR
የ LSQR ዘዴ የተመሰረተው በ
ነገር ግን ማትሪክስ እንደሆነ ከወሰድን በአግድም የተከፋፈለ ነው፣ ከዚያም እያንዳንዱ ድግግሞሽ እንደ ሁለት MapReduce ደረጃዎች ሊወከል ይችላል። በዚህ መንገድ በእያንዳንዱ ድግግሞሽ ጊዜ የውሂብ ዝውውሮችን መቀነስ ይቻላል (ከማይታወቁ ቁጥር ጋር እኩል የሆነ ርዝመት ያላቸው ቬክተሮች ብቻ)
መስመራዊ ሪግሬሽን ወደ ውስጥ ሲተገበር ጥቅም ላይ የሚውለው ይህ አካሄድ ነው።
መደምደሚያ
ብዙ የመስመሮች ሪግሬሽን መልሶ ማግኛ ስልተ ቀመሮች አሉ, ነገር ግን ሁሉም በሁሉም ሁኔታዎች ውስጥ ሊተገበሩ አይችሉም. ስለዚህ QR መበስበስ በትንሽ የውሂብ ስብስቦች ላይ ለትክክለኛ መፍትሄ በጣም ጥሩ ነው. የግራዲየንት መውረድ ለመተግበር ቀላል ነው እና ግምታዊ መፍትሄ በፍጥነት እንዲያገኙ ያስችልዎታል። እና LSQR የቀደሙትን ሁለት ስልተ ቀመሮች ምርጥ ባህሪያትን ያጣምራል ፣ ምክንያቱም ሊሰራጭ ስለሚችል ፣ ከቅልመት ቁልቁለት ጋር ሲነፃፀር በፍጥነት ይሰበሰባል ፣ እና እንዲሁም ግምታዊ መፍትሄ ለማግኘት አልጎሪዝምን ቀደም ብሎ ማቆምን ያስችላል ፣ እንደ QR መበስበስ።
ምንጭ: hab.com