Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

Maya, si fiican, dabcan, dhab ma ihi. Waa in la xadidaa ilaa inta ay suurtagal tahay in mawduuc la fududeeyo. Laakiin marxaladaha ugu horreeya, fahamka fikradaha aasaasiga ah iyo si degdeg ah "gelitaanka" mawduuca, waxaa laga yaabaa in la aqbalo. Waxaan ka wada hadli doonaa sida saxda ah ee loo magacaabo walxahan (doorashooyinka: "Barashada Mashiinka ee Dumiyada", "Falanqaynta xogta xafaayadda", "Algorithms ee kuwa yaryar") dhamaadka.

Xagga meesha. Waxa uu ku qoray dhowr barnaamij oo codsi ah MS Excel si uu u eego iyo u muujinta aragga ee hababka ka dhaca hababka barashada mashiinka ee kala duwan marka la falanqeynayo xogta. Aragtida waa rumaynta, ka dib oo dhan, sida kuwa dhaqanku ay yiraahdaan, kuwaas oo soo saaray hababkan intooda badan (sida, dhammaanteed ma aha. Midka ugu awoodda badan "mashiinka taageerada", ama SVM, mashiinka taageerada taageerada waa abuurista Vladimir Vapnik, Moscow Institute of Management.

Saddex fayl oo dib-u-eegis ah

1. K-macnaheedu waa kooxaysi

Dhibaatooyinka noocaan ah waxay tixraacaan "waxbarasho aan la ilaalin," marka aan u baahanahay inaan u qaybino xogta bilowga ah tiro cayiman oo qaybo ah oo horay loo yaqaan, laakiin ma hayno tiro "jawaabo sax ah"; waa inaan ka soo saarnaa xogta lafteeda. . Dhibaatada qadiimiga ah ee aasaasiga ah ee helitaanka noocyada kala duwan ee ubaxyada iris (Ronald Fisher, 1936!), Taas oo loo tixgeliyo calaamadda koowaad ee goobtan aqoonta, waa dabeecaddan oo kaliya.

Habka waa mid aad u fudud. Waxaan haynaa walxo isku dhafan oo u taagan sida vectors (tirooyinka N). In irises, kuwani waa tirooyin 4 ah oo tilmaamaya ubaxa: dhererka iyo ballaca bannaanka iyo gudaha gudaha ee perianth, siday u kala horreeyaan (Fischer's irises - Wikipedia). Qiyaasta caadiga ah ee Kartisia waxaa loo doortaa masaafada, ama cabbirka u dhowaanshaha walxaha.

Marka xigta, xarumaha kooxdu si aan kala sooc lahayn ayaa loo doortaa (ama si aan kala sooc lahayn, hoos eeg), masaafada u jirta shay kasta ilaa xarumaha kooxdu waa la xisaabiyaa. Shay kasta marka la eego tillaabada dib-u-celinta waxaa lagu calaamadeeyay inuu leeyahay xarunta ugu dhow. Kadibna xarunta koox kasta waxaa loo wareejiyaa celceliska xisaabaadka ee iskudubaridyada xubnaheeda (iyaga oo la mid ah fiisigiska, waxaa sidoo kale loo yaqaan "xarunta mass"), habraacuna waa soo noqnoqda.

Hawshu si dhakhso leh ayay isugu xidhmaysaa. Sawirada oo laba dhinac ah waxay u eeg yihiin sidan:

1. Qaybinta dhibcaha diyaaradda iyo tirada kooxaha

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

2. Sheegidda xarumaha kooxda iyo u qoondaynta dhibcaha kooxahooda

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

3. Wareejinta isku-duwayaasha xarumaha kooxda, dib u xisaabinta isku xidhka dhibcaha ilaa xarumaha ay xasiliyaan. Meesha ay xarunta kooxdu u guurayso meesheedii u dambaysay ayaa muuqata.

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

Waqti kasta, waxaad dejin kartaa xarumo kooxeed cusub (adigoon dhalin qaybin cusub oo dhibco ah!) Oo arag in habka qaybinta aanu had iyo jeer mugdi ku jirin. Xisaab ahaan, tani waxay ka dhigan tahay in shaqada la hagaajiyay (isku geynta masaafada labajibaaran ee dhibcaha ilaa xarumaha kooxahooda), ma helno mid caalami ah, laakiin ugu yaraan maxalli ah. Dhibaatadan waxaa looga gudbi karaa iyada oo la dooranayo aan random ah oo ah xarumaha kooxeed ee bilowga ah, ama in la tiriyo xarumaha suurtagalka ah (mararka qaarkood waxaa faa'iido leh in si sax ah loo dhigo mid ka mid ah dhibcaha, ka dibna ugu yaraan waxaa jira dammaanad ah inaanan faaruqin doonin. kooxo). Si kastaba ha ahaatee, gogol xaddidan ayaa had iyo jeer leh wax aan fiicneyn.

Waxaad ku ciyaari kartaa faylkan linkigan (ha iloobin inaad karti u geliso taageerada macro. Faylasha waxaa laga baaray fayras)

Sharaxaada habka Wikipedia - k-macneheedu waa hab

2. Qiyaasta tirada badan iyo burburka xogta. Dib u tabobar

Saynis yahan cajiib ah iyo caan baxay cilmiga xogta K.V. Vorontsov wuxuu si kooban u qeexay hababka barashada mashiinka sida "sayniska sawirida qalooca iyada oo loo marayo dhibcaha." Tusaalahan, waxaan ka heli doonaa qaab xogta iyadoo la adeegsanayo habka ugu yar ee labajibbaaran.

Farsamada loo qaybiyo xogta isha ee "tababarka" iyo "xakamaynta" ayaa la muujiyay, iyo sidoo kale ifafaale sida dib-u-habaynta, ama "dib-u-habaynta" xogta. Qiyaasta saxda ah, waxaan ku yeelan doonaa qalad gaar ah xogta tababarka iyo qalad yar oo ka weyn xogta xakamaynta. Haddii aysan sax ahayn, waxay keentaa in si sax ah loo hagaajiyo xogta tababarka iyo khalad weyn oo ku saabsan xogta imtixaanka.

(Waa xaqiiqo si fiican loo yaqaan in iyada oo loo marayo dhibcaha N uu qofku sawiri karo hal qalooc oo ah shahaadada N-1th, habkanina kiiska guud ma siinayo natiijada la rabo. Lagrange interpolation polynomial ee Wikipedia)

1. Deji qaybinta bilowga ah

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

2. Waxaan u qaybin dhibcaha "tababarka" iyo "xakamaynta" saamiga 70 ilaa 30.

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

3. Waxaan ku sawirnaa qalooca u dhow ee dhinaca dhibcaha tababarka, waxaan aragnaa qaladka ay bixiso xogta xakamaynta

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

4. Waxaan ku sawirnaa qalooca saxda ah iyada oo loo marayo dhibcaha tababarka, waxaanan aragnaa qalad weyn oo ku saabsan xogta xakamaynta (iyo eber xogta tababarka, laakiin waa maxay macnaha?).

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

Muujiyay, dabcan, waa ikhtiyaarka ugu fudud oo leh hal qayb oo loo qaybiyo "tababarka" iyo "xakamaynta" hoosaadyada; Xaaladda guud, tan waxaa la sameeyaa marar badan si loo hagaajiyo isku-dhafka ugu fiican.

Faylku waa laga heli karaa halkan, oo lagu sawiray antivirus. Daar macros si ay u hawlgal sax ah

3. Soo degid tartiib tartiib ah iyo dhaqdhaqaaqa isbeddelka khaladka

Waxaa jiri doona kiis 4-gees ah iyo dib u dhac toos ah. Isku-dubaridka toosan ee dib-u-celinta waxaa lagu go'aamin doonaa tallaabo-tallaabo iyadoo la adeegsanayo habka soo degitaanka gradient, marka hore dhammaan isku-xirayaashu waa eber. Garaafka goonida ah ayaa tusinaya dhaqdhaqaaqa dhimista khaladka maadaama iskuxirayaasha si sax ah loo hagaajiyay. Waa suurtogal in la eego dhammaan afarta saadaal ee 2-cabbirka ah.

Haddii aad dejiso tillaabada soo degista mid aad u weyn, waxaad arki kartaa in mar kasta aan ka boodi doono ugu yaraan oo aan ku gaari doono natiijada tiro tillaabo ah, in kasta oo dhamaadka aan weli imaan doono (haddii aan dib loo dhigin tallaabada soo degista sidoo kale wax badan - ka dibna algorithm ayaa tagi doona "in spades"). Iyo garaafka qaladka ee ku xiran tallaabada dib-u-celinta ma noqon doonto mid siman, laakiin "jaritaan".

1. Abuur xog, deji tallaabada soo degitaanka gradient

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

2. Iyada oo xulashada saxda ah ee tallaabada hoos udhaca gradient, waxaan si habsami leh oo degdeg ah u gaarnaa ugu yaraan

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

3. Haddi si qaldan loo xushay tallaabada gradient-ka, waxaan ka badineynaa ugu badnaan, garaafka qaladku waa "jari"

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale
ΠΈ

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

4. Haddi aan si khaldan u doorano tilaabada soo degitaanka gradient, waxa aanu ka guuraynaa waxa ugu yar

Barashada mashiinka bilaa Python, Anaconda iyo xamaaratada kale

(Si aad dib ugu soo saarto habka adoo isticmaalaya qiyamka talabada hoos u dhaca ee ka muuqda sawirada, calaamee sanduuqa "xogta tixraac").

Faylku wuxuu ku yaalaa xiriirkan, waxaad u baahan tahay inaad karti u yeelato macros, ma jiraan wax fayras ah.

Marka loo eego bulshada la ixtiraamo, fududayntan iyo habka loo soo bandhigo walxaha ma la aqbali karaa? Ma mudan tahay in maqaalka loo turjumo Ingiriisiga?

Source: www.habr.com

Add a comment