አይ፣ ደህና፣ በእርግጥ እኔ ቁምነገር አይደለሁም። ርዕሰ ጉዳዩን ለማቃለል የሚቻለው መጠን ገደብ ሊኖረው ይገባል. ግን ለመጀመሪያዎቹ ደረጃዎች መሰረታዊ ፅንሰ-ሀሳቦችን መረዳት እና ርዕሱን በፍጥነት "መግባት" ተቀባይነት ሊኖረው ይችላል. እና ይህንን ቁሳቁስ በትክክል እንዴት መሰየም እንደሚቻል (አማራጮች-"ማሽን መማር ለዳሚዎች", "ከዳይፐር የተገኘ መረጃ ትንተና", "አልጎሪዝም ለትንንሾቹ"), በመጨረሻው ላይ እንነጋገራለን.
ወደ ንግድ ሥራ። መረጃን በሚተነተንበት ጊዜ በተለያዩ የማሽን መማሪያ ዘዴዎች ውስጥ የሚከሰቱ ሂደቶችን ለማየት እና ለማየት በ MS Excel ውስጥ በርካታ የመተግበሪያ ፕሮግራሞችን ፃፈ። እነዚህን ዘዴዎች ያዳበሩት ባሕል ተሸካሚዎች እንደሚሉት በመጨረሻ ማየት ማመን ነው (በነገራችን ላይ ሁሉም አይደሉም። በጣም ኃይለኛው “የድጋፍ ቬክተር ማሽን” ወይም SVM የድጋፍ ቬክተር ማሽን የ የአገራችን ልጅ ቭላድሚር ቫፕኒክ, የሞስኮ አስተዳደር ተቋም. 1963, በነገራችን ላይ! አሁን ግን ያስተምራል እና በአሜሪካ ውስጥ ይሰራል).
1. ክላስተር በ k-means
የዚህ አይነት ችግሮች “ክትትል የለሽ ትምህርት”ን ያመለክታሉ ፣ምንጩን መረጃ ወደ አንዳንድ ቀደምት የታወቁ ምድቦች መከፋፈል ሲገባን ፣ነገር ግን በተመሳሳይ ጊዜ ምንም ቁጥር የለንም “ትክክለኛ መልሶች” ፣ ከነሱ ማውጣት አለብን። መረጃው ራሱ. የዚህ የእውቀት መስክ የመጀመሪያ ምልክት ተደርጎ የሚወሰደው የአይሪስ አበቦች ንዑስ ዝርያዎችን የማግኘት መሠረታዊው ክላሲካል ችግር (ሮናልድ ፊሸር ፣ 1936!) እንደዚህ ያለ ተፈጥሮ ነው።
ዘዴው በጣም ቀላል ነው. እንደ ቬክተር (የኤን ቁጥሮች ስብስቦች) የተወከሉ ነገሮች ስብስብ አለን። በአይሪስ ውስጥ እነዚህ የአበባውን ባህሪ የሚያሳዩ የ 4 ቁጥሮች ስብስቦች ናቸው-የውጫዊ እና የውስጥ ፔሪያን ክፍሎች ርዝመት እና ስፋት (በቅደም ተከተል)
በተጨማሪም በዘፈቀደ (ወይም በዘፈቀደ አይደለም, ከታች ይመልከቱ) የክላስተር ማዕከሎች ተመርጠዋል, እና ከእያንዳንዱ ነገር እስከ ክላስተር ማእከሎች ርቀቶች ይሰላሉ. በተሰጠው የመድገም ደረጃ ላይ ያለ እያንዳንዱ ነገር የቅርቡ ማእከል እንደሆነ ምልክት ተደርጎበታል። ከዚያም የእያንዳንዱ ክላስተር ማእከል ወደ የአባላቶቹ መጋጠሚያዎች የሂሳብ አማካኝ (ከፊዚክስ ጋር በማመሳሰል, "የጅምላ ማእከል" ተብሎም ይጠራል) እና አሰራሩ ይደገማል.
ሂደቱ በትክክል በፍጥነት ይከናወናል. በሥዕሎቹ ላይ በሁለት ገጽታዎች ላይ እንደዚህ ይመስላል
1. በአውሮፕላኑ ላይ የነጥቦችን የመጀመሪያ እና የዘፈቀደ ስርጭት እና የክላስተር ብዛት
2. የክላስተር ማዕከሎችን ማዘጋጀት እና ነጥቦችን ወደ ቡድኖቻቸው መመደብ
3. የክላስተር ማእከሎች መጋጠሚያዎችን ማስተላለፍ, ማዕከሎቹ እስኪረጋጉ ድረስ የነጥቦችን ባለቤትነት እንደገና በማስላት. የክላስተር ማእከል ወደ መጨረሻው ቦታ የሚወስደው አቅጣጫ ይታያል።
በማንኛውም ጊዜ አዲስ የክላስተር ማዕከሎችን ማዘጋጀት ይችላሉ (አዲስ የነጥብ ስርጭት ሳይፈጥሩ!) እና የመከፋፈል ሂደቱ ሁልጊዜ የማያሻማ እንዳልሆነ ይመልከቱ. በሂሳብ ፣ ይህ ማለት የተመቻቸ ተግባር (ከነጥቦች እስከ ክላስተር ማዕከሎች ያለው የካሬ ርቀቶች ድምር) ዓለም አቀፍ ሳይሆን የአካባቢ ዝቅተኛ እናገኛለን ማለት ነው። ይህንን ችግር በዘፈቀደ ባልሆነ ምርጫ የክላስተር ማእከሎች ምርጫ ወይም ሊሆኑ የሚችሉ ማዕከሎችን በመቁጠር (አንዳንድ ጊዜ በትክክል በአንዱ ነጥብ ላይ ማስቀመጥ ጠቃሚ ነው ፣ ከዚያ ቢያንስ እኛ እንደማንፈልግ ዋስትና አለ) ። ባዶ ስብስቦችን ያግኙ)። ያም ሆነ ይህ, ውሱን ስብስብ ሁልጊዜ የአካል ብቃት እንቅስቃሴ የለውም.
በዊኪፔዲያ ላይ ያለው ዘዴ መግለጫ -
2. በፖሊኖሚሎች መጠጋጋት እና የውሂብ መከፋፈል. እንደገና ማሰልጠን
አስደናቂ ሳይንቲስት እና የውሂብ ሳይንስ ታዋቂ K.V. ቮሮንትሶቭ ስለ ማሽን መማሪያ ዘዴዎች በአጭሩ ይናገራል "በነጥቦች ውስጥ ኩርባዎችን የመሳል ሳይንስ"። በዚህ ምሳሌ ውስጥ በትንሹ የካሬዎች ዘዴ በመጠቀም በመረጃው ውስጥ ስርዓተ-ጥለት እናገኛለን።
የመጀመሪያውን መረጃ ወደ "ስልጠና" እና "ቁጥጥር" የመከፋፈል ዘዴ, እንዲሁም እንደ ከመጠን በላይ መገጣጠም, ወይም "እንደገና ማስተካከል" በመረጃው ላይ ይታያል. በትክክለኛ ግምት፣ በስልጠናው መረጃ ላይ የተወሰነ ስህተት እና በቁጥጥር ውሂቡ ላይ ትንሽ ትልቅ ስህተት ይኖረናል። ትክክል ካልሆነ በስልጠናው መረጃ ላይ ጥሩ ማስተካከያ እና በመቆጣጠሪያዎቹ ላይ ትልቅ ስህተት.
(በ N ነጥቦች በኩል የ N-1 ኛ ዲግሪ አንድ ነጠላ ኩርባ መሳል እንደሚቻል በጣም የታወቀ እውነታ ነው, እና ይህ ዘዴ በአጠቃላይ የሚፈለገውን ውጤት አይሰጥም.
1. የመጀመሪያውን ስርጭት ያዘጋጁ
2. ከ 70 እስከ 30 ባለው ሬሾ ውስጥ ነጥቦቹን ወደ "ስልጠና" እና "ቁጥጥር" እንከፍላለን.
3. በስልጠና ነጥቦቹ ላይ ግምታዊ ኩርባ እናሳያለን, በመቆጣጠሪያው መረጃ ላይ የሚሰጠውን ስህተት እናያለን.
4. በስልጠና ነጥቦቹ ውስጥ ትክክለኛውን ኩርባ እናሳያለን, እና በመቆጣጠሪያው መረጃ ላይ (እና በስልጠናዎቹ ላይ ዜሮ, ግን ነጥቡ?) ላይ አስከፊ ስህተት እናያለን.
እርግጥ ነው, ቀላሉ ስሪት በአንድ ክፍልፍል ወደ "ስልጠና" እና "ቁጥጥር" ንዑስ ክፍሎች ይታያል, በአጠቃላይ ሁኔታ, ይህ ለትክክለኛዎቹ ቅንጅቶች ማስተካከያ በተደጋጋሚ ይከናወናል.
3. ቀስ በቀስ መውረድ እና የስህተት ተለዋዋጭነት
እዚህ ባለ 4-ልኬት መያዣ እና መስመራዊ ሪግሬሽን ይኖራል። የመስመራዊ ሪግሬሽን ውህደቶች የግራዲየንት መውረድ ዘዴን በመጠቀም ደረጃ በደረጃ ይወሰናሉ፣ መጀመሪያ ላይ ሁሉም ጥምርታዎች ዜሮ ናቸው። የተለየ ግራፍ ስህተቱ እየቀነሰ የሚሄደውን ተለዋዋጭነት ያሳያል ምክንያቱም ቅንጅቶቹ በደንብ የተስተካከሉ እና ብዙ ናቸው። ሁሉንም አራት 2D ትንበያዎችን ማየት ይቻላል.
የግራዲየንት መውረጃውን በጣም ትልቅ ካደረግነው በእያንዳንዱ ጊዜ ዝቅተኛውን መዝለል እንደምንችል እና ውጤቱን በብዙ ደረጃዎች እንደምንደርስ ግልፅ ነው ፣ ምንም እንኳን በመጨረሻ ፣ አሁንም እንመጣለን (የቁልቁለትን ደረጃ በጣም ካላዘገየን በስተቀር - ከዚያ ስልተ ቀመር ይሄዳል "በችግር ውስጥ"). እና በድግግሞሹ ደረጃ ላይ ያለው የስህተቱ ጥገኝነት ግራፍ ለስላሳ አይሆንም, ነገር ግን "ጠንካራ" ይሆናል.
1. ውሂብ ይፍጠሩ፣ የግራዲየንት መውረድ ደረጃን ያዘጋጁ
2. በትክክለኛው የግራዲየንት ቁልቁል ደረጃ ምርጫ፣ በተቀላጠፈ እና በፍጥነት በቂ ወደ ዝቅተኛ ደረጃ እንመጣለን።
3. የግራዲየንት መውረጃ ደረጃው በተሳሳተ መንገድ ከተመረጠ ከፍተኛውን እንዘልላለን ፣ የስህተት ግራፉ “ትዊች” ነው ፣ ውህደት ብዙ እርምጃዎችን ይወስዳል።
и
4. የግራዲየንት መውረጃ ደረጃ ሙሉ በሙሉ የተሳሳተ ምርጫ, ከዝቅተኛው እንርቃለን
(በሥዕሎቹ ላይ በሚታዩት ቀስ በቀስ የመውረድ ደረጃዎች ላይ ሂደቱን እንደገና ለማባዛት "የማጣቀሻ ውሂብ" ሳጥን ላይ ምልክት ያድርጉ).
የተከበረው ማህበረሰብ እንደሚለው፣ እንዲህ ዓይነቱን የማቅለል ዘዴ እና ቁሳቁስ የማቅረብ ዘዴ ተቀባይነት አለው? ጽሑፉ ወደ እንግሊዝኛ መተርጎም አለበት?
ምንጭ: hab.com