Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

Che, hantle, ha e le hantle, ha kea teba. Ho tlameha ho be le moeli oa hore na ho ka khoneha ho nolofatsa thuto ho isa bohōleng bofe. Empa bakeng sa mekhahlelo ea pele, ho utloisisa likhopolo tsa motheo le ho potlakela ho "kena" sehlooho, e ka 'na ea amoheleha. Re tla tšohla mokhoa oa ho reha boitsebiso bona ka mokhoa o nepahetseng (likgetho: "Ho ithuta mochine bakeng sa li-dummies", "Tlhahlobo ea data ho tloha ho li-diaper", "Algorithms bakeng sa bana ba banyenyane") qetellong.

Ho fihlela ntlha. O ngotse mananeo a 'maloa a ts'ebeliso ho MS Excel bakeng sa pono le kemelo ea pono ea lits'ebetso tse etsahalang ka mekhoa e fapaneng ea ho ithuta ka mochini ha o sekaseka data. Ho bona ke ho lumela, ka mor'a tsohle, joalokaha bajari ba setso ba re, e leng se ntlafalitseng boholo ba mekhoa ena (ka tsela, eseng kaofela. "Mochini oa vector" o matla ka ho fetisisa, kapa SVM, mochine oa vector oa tšehetso ke ho qaptjoa ha motsoalle oa rona Vladimir Vapnik, Setsi sa Tsamaiso sa Moscow. 1963, ka tsela! Joale, leha ho le joalo, o ruta le ho sebetsa USA).

Lifaele tse tharo tsa tlhahlobo

1. K-e bolela ho bokellana

Mathata a mofuta ona a bua ka "thuto e sa laoleheng," ha re hloka ho arola lintlha tsa pele ka palo e itseng ea lihlopha tse tsejoang esale pele, empa ha re na "likarabo tse nepahetseng"; re tlameha ho li ntša ho data ka boeona. . Bothata ba mantlha ba khale ba ho fumana li-subspecies tsa lipalesa tsa iris (Ronald Fisher, 1936!), E nkoang e le letšoao la pele la lefapha lena la tsebo, ke la mofuta ona feela.

Mokhoa o bonolo haholo. Re na le sehlopha sa lintho tse emetsoeng e le li-vector (sete sa linomoro tsa N). Li-irises, tsena ke lihlopha tsa linomoro tse 4 tse khethollang palesa: bolelele le bophara ba lobes tse ka ntle le tse ka hare tsa perianth, ka ho latellana (Fischer's irises - Wikipedia). Metric e tloaelehileng ea Cartesian e khethoa e le sebaka, kapa tekanyo ea sebaka se pakeng tsa lintho.

Ka mor'a moo, litsi tsa lihlopha li khethoa ka mokhoa o sa reroang (kapa eseng ka mokhoa o sa reroang, sheba ka tlase), 'me libaka tse tsoang ho ntho e' ngoe le e 'ngoe ho ea ho litsi tsa lihlopha li baloa. Ntho e 'ngoe le e 'ngoe mohatong o fanoeng oa ho pheta-pheta e tšoauoa e le ea setsi se haufi haholo. Ebe setsi sa sehlopha se seng le se seng se fetisetsoa ho palo ea lipalo tsa lihokahanyo tsa litho tsa eona (ka papiso le fisiks, e boetse e bitsoa "bohareng ba boima"), 'me mokhoa ona o phetoa.

Ts'ebetso e kopana kapele haholo. Litšoantšong ka litekanyo tse peli e shebahala tjena:

1. Kabo ea pele e sa reroang ea lintlha sefofaneng le palo ea lihlopha

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

2. Ho totobatsa litsi tsa lihlopha le ho fana ka lintlha ho lihlopha tsa tsona

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

3. Ho fetisetsa lihokahanyo tsa litsi tsa lihlopha, ho tsosolosa ho kopana ha lintlha ho fihlela litsi li tsitsisa. Tsela ea setsi sa lihlopha se fallelang sebakeng sa sona sa ho qetela sea bonahala.

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

Ka nako leha e le efe, o ka beha litsi tse ncha tsa lihlopha (ntle le ho hlahisa kabo e ncha ea lintlha!) 'me u bone hore mokhoa oa ho arola ha se kamehla o sa tsitsang. Ho ea ka lipalo, sena se bolela hore bakeng sa ts'ebetso e ntlafalitsoeng (kakaretso ea bohole ba lisekoere ho tloha ho lintlha ho ea bohareng ba lihlopha tsa bona), ha re fumane bonyane ba lefats'e, empa bonyane ba lehae. Bothata bona bo ka hlōloa ka khetho e sa reroang ea litsi tsa pele tsa lihlopha, kapa ka ho bala litsi tse ka khonehang (ka linako tse ling ho molemo ho li beha hantle ho e 'ngoe ea lintlha, ebe bonyane ho na le tiiso ea hore re ke ke ra fumana letho. lihlopha). Leha ho le joalo, sete e lekanyelitsoeng e lula e na le infimum.

U ka bapala ka faele ena sehokelong sena (u seke oa lebala ho thusa ts'ehetso ea macro. Lifaele li hlahlobiloe bakeng sa livaerase)

Tlhaloso ea mokhoa ho Wikipedia - k-ho bolela mokhoa

2. Ho hakanngoa ke li-polynomials le ho senyeha ha data. Ho koetlisa bocha

Rasaense ea ikhethang le setumo sa saense sa data K.V. Vorontsov o hlalosa ka bokhutšoane mekhoa ea ho ithuta ka mochini e le "saense ea ho taka e pota-pota ka lintlha." Mohlaleng ona, re tla fumana mohlala ho data re sebelisa mokhoa o fokolang oa lisekoere.

Mokhoa oa ho arola lintlha tsa mohloli ho "koetliso" le "taolo" e bontšoa, hammoho le ntho e kang ho koetlisa, kapa "ho fetola hape" ho data. Ka khakanyo e nepahetseng, re tla ba le phoso e itseng ho data ea koetliso le phoso e kholoanyane ho data ea taolo. Haeba e fosahetse, e fella ka tokiso e nepahetseng ho data ea koetliso le phoso e kholo ho data ea tlhahlobo.

(Ke taba e tsebahalang haholo hore ka lintlha tsa N motho a ka hula sekhahla se le seng sa tekanyo ea N-1, mme mokhoa ona ka kakaretso ha o fane ka sephetho se lakatsehang. Lagrange interpolation polynomial ho Wikipedia)

1. Beha kabo ea pele

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

2. Re arola lintlha ka "koetliso" le "taolo" ka karolelano ea 70 ho ea ho 30.

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

3. Re hula sekhahla se haufi le lintlha tsa koetliso, re bona phoso eo e fanang ka eona ho data ea taolo.

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

4. Re hula lekhalo le nepahetseng ka lintlha tsa koetliso, 'me re bona phoso e makatsang ho data ea taolo (le zero ho data ea koetliso, empa ntlha ke efe?).

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

Ho bontšitsoe, ehlile, ke khetho e bonolo ka ho fetesisa e nang le karohano e le 'ngoe ho li-subsets tsa "koetliso" le "taolo"; ka kakaretso, sena se etsoa hangata bakeng sa tokiso e ntle ea li-coefficients.

Faele e fumaneha mona, e hlahlojoa ke antivirus. Lumella li-macro bakeng sa ts'ebetso e nepahetseng

3. Ho theoha ha likhahla le matla a phetoho ea phoso

Ho tla ba le nyeoe ea 4-dimensional le linear regression. Li-coefficients tsa linear regression li tla khethoa mohato ka mohato ho sebelisa mokhoa oa ho theoha ha gradient, qalong li-coefficients tsohle ke zero. Kerafo e arohaneng e bonts'a matla a ho fokotsa liphoso ha li-coefficients li ntse li lokisoa ka nepo le ho feta. Hoa khoneha ho sheba likhakanyo tse 'ne tsa 2-dimensional.

Haeba u beha mohato oa ho theola sekhahla se seholo haholo, u ka bona hore nako le nako re tla tlola bonyane ebe re tla fihla sephetho ka mehato e mengata e kholoanyane, leha qetellong re ntse re tla fihla (ntle le haeba re lieha ho theoha hape. haholo - joale algorithm e tla tsamaea "ka li-spades"). 'Me graph ea phoso ho itšetlehile ka mohato oa ho pheta-pheta e ke ke ea e-ba boreleli, empa "jerky".

1. Hlahisa data, beha mohato oa ho theoha ha gradient

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

2. Ka khetho e nepahetseng ea mohato oa ho theoha ha gradient, re fihla hantle le ka potlako ho fihlela bonyane

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

3. Haeba mohato oa ho theoha ha gradient o khethiloe ka tsela e fosahetseng, re fetisa boholo, graph ea phoso ke "jerky", convergence e nka mehato e mengata e kholoanyane.

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling
и

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

4. Haeba re khetha mohato oa ho theoha ha gradient ka mokhoa o fosahetseng ka ho feletseng, re tloha ho bonyane

Ho ithuta ka mochini ntle le Python, Anaconda le lihahabi tse ling

(Ho hlahisa ts'ebetso ka ho sebelisa litekanyetso tsa "gradient descent" tse bontšitsoeng litšoantšong, sheba lebokose la "reference data").

Faele e sehokelong sena, o hloka ho nolofalletsa li-macros, ha ho na livaerase.

Ho ea ka sechaba se hlomphuoang, na ho nolofatsa lintho joalo le mokhoa oa ho nehelana ka boitsebiso lia amoheleha? Na ho bohlokoa ho fetolela sengoloa ho Senyesemane?

Source: www.habr.com

Eketsa ka tlhaloso