Aprantisaj machin san Python, Anaconda ak lòt reptil

Non, byen, nan kou, mwen pa grav. Dwe gen yon limit nan ki pwen li posib senplifye yon sijè. Men, pou premye etap yo, konprann konsèp debaz yo epi byen vit "antre" sijè a, li ka akseptab. Nou pral diskite sou fason yo kòrèkteman non materyèl sa a (opsyon: "Aprann machin pou nul", "Analiz done ki soti nan kouchèt", "Algoritm pou timoun piti yo") nan fen an.

Nan pwen an. Ekri plizyè pwogram aplikasyon nan MS Excel pou vizyalizasyon ak reprezantasyon vizyèl nan pwosesis ki rive nan diferan metòd aprantisaj machin lè analize done. Wè se kwè, apre tout, jan moun ki gen kilti a di, ki devlope pi fò nan metòd sa yo (nan chemen an, se pa tout nan yo. Ki pi pwisan "machin vektè sipò", oswa SVM, machin vektè sipò se envansyon nan Konpatriyòt nou an Vladimir Vapnik, Moskou Enstiti Jesyon. 1963, nan chemen an! Kounye a, sepandan, li anseye ak travay nan USA a).

Twa dosye pou revize

1. K-vle di clustering

Pwoblèm nan kalite sa yo refere a "aprantisaj san sipèvizyon," lè nou bezwen divize premye done yo nan yon sèten kantite kategori li te ye davans, men nou pa gen okenn kantite "repons kòrèk"; nou dwe ekstrè yo nan done yo li menm. . Pwoblèm fondamantal klasik nan jwenn subspecies nan flè iris (Ronald Fisher, 1936!), ki konsidere kòm premye siy nan domèn konesans sa a, se jis nan nati sa a.

Metòd la se byen senp. Nou gen yon seri objè ki reprezante kòm vektè (ansanm N nimewo). Nan iris, sa yo se seri 4 nimewo ki karakterize flè a: longè ak lajè teb ekstèn ak enteryè perianth la, respektivman (Iris Fischer a - Wikipedya). Se metrik abityèl katezyen yo chwazi kòm distans la, oswa mezi pwoksimite ant objè yo.

Apre sa, sant gwoup yo chwazi owaza (oswa pa owaza, gade anba a), epi yo kalkile distans ki genyen ant chak objè ak sant gwoup yo. Chak objè nan yon etap iterasyon bay yo make kòm ki fè pati sant ki pi pre a. Lè sa a, sant chak gwoup transfere nan mwayen aritmetik nan kowòdone manm li yo (pa analoji ak fizik, yo rele li tou "sant nan mas"), epi pwosedi a repete.

Pwosesis la konvèje byen vit. Nan foto nan de dimansyon li sanble sa a:

1. Premye distribisyon o aza pwen sou avyon an ak kantite grap yo

Aprantisaj machin san Python, Anaconda ak lòt reptil

2. Espesifye sant grap yo ak plase pwen nan grap yo

Aprantisaj machin san Python, Anaconda ak lòt reptil

3. Transfere kowòdone sant gwoup yo, rekalkile afilyasyon pwen yo jiskaske sant yo estabilize. Trajectory sant gwoup la k ap deplase nan pozisyon final li vizib.

Aprantisaj machin san Python, Anaconda ak lòt reptil

A nenpòt ki lè, ou ka mete nouvo sant gwoup (san yo pa jenere yon nouvo distribisyon pwen!) epi wè ke pwosesis patisyon an pa toujou klè. Matematikman, sa vle di ke pou fonksyon ke yo te optimize (som la nan kare distans yo soti nan pwen yo nan sant yo nan grap yo), nou jwenn pa yon global, men yon minimòm lokal. Pwoblèm sa a ka simonte swa pa yon chwa ki pa o aza nan premye sant gwoup, oswa pa enumere sant posib (pafwa li se avantaje yo mete yo egzakteman nan youn nan pwen yo, Lè sa a, omwen gen yon garanti ke nou pa pral jwenn vid. grap). Nan nenpòt ka, yon seri fini toujou gen yon enfim.

Ou ka jwe ak dosye sa a nan lyen sa a (pa bliye pèmèt sipò macro. Yo tcheke dosye yo pou viris yo)

Deskripsyon metòd la sou Wikipedya - k-vle di metòd

2. Apwoksimasyon pa polinòm ak dekonpozisyon done. Refòmasyon

Syantis remakab ak vulgarize nan syans done K.V. Vorontsov yon ti tan dekri metòd aprantisaj machin yo kòm "syans nan trase koub nan pwen." Nan egzanp sa a, nou pral jwenn yon modèl nan done yo lè l sèvi avèk metòd la pi piti kare.

Yo montre teknik pou divize done sous yo an "fòmasyon" ak "kontwòl", osi byen ke yon fenomèn tankou re-formation, oswa "re-ajiste" nan done yo. Avèk apwoksimasyon kòrèk, nou pral gen yon erè sèten sou done fòmasyon yo ak yon erè yon ti kras pi gwo sou done yo kontwòl. Si sa pa kòrèk, sa lakòz ajisteman egzak nan done fòmasyon yo ak yon gwo erè sou done tès yo.

(Li se yon reyalite byen li te ye ke atravè N pwen yon moun ka trase yon koub sèl nan N-1yèm degre, ak metòd sa a nan ka jeneral la pa bay rezilta a vle. Polinòm entèpolasyon Lagrange sou Wikipedya)

1. Mete distribisyon inisyal la

Aprantisaj machin san Python, Anaconda ak lòt reptil

2. Nou divize pwen yo an "fòmasyon" ak "kontwòl" nan yon rapò 70 a 30.

Aprantisaj machin san Python, Anaconda ak lòt reptil

3. Nou trase koub apwoksimatif la ansanm pwen fòmasyon yo, nou wè erè li bay sou done kontwòl yo.

Aprantisaj machin san Python, Anaconda ak lòt reptil

4. Nou trase yon koub egzak atravè pwen fòmasyon yo, epi nou wè yon erè kolosal sou done kontwòl yo (ak zewo sou done fòmasyon yo, men ki sa ki pwen an?).

Aprantisaj machin san Python, Anaconda ak lòt reptil

Yo montre, nan kou, opsyon ki pi senp la ak yon sèl divizyon nan "fòmasyon" ak "kontwòl" sou-ansanm; nan ka jeneral, sa a se fè anpil fwa pou ajisteman nan pi bon nan koyefisyan yo.

Fichye a disponib isit la, analize pa antivirus. Pèmèt makro pou operasyon kòrèk

3. Desandan gradyan ak dinamik chanjman erè

Pral gen yon ka 4 dimansyon ak regression lineyè. Koefisyan regression lineyè yo pral detèmine etap pa etap lè l sèvi avèk metòd desandan gradyan, okòmansman tout koyefisyan yo se zewo. Yon graf separe montre dinamik rediksyon erè pandan koyefisyan yo ap ajiste pi plis ak plis presizyon. Li posib pou wè tout kat pwojeksyon 2 dimansyon.

Si ou mete etap desant gradyan an twò gwo, ou ka wè ke chak fwa nou pral sote minimòm nan epi yo pral rive nan rezilta a nan yon pi gwo kantite etap, byenke nan fen a nou ap toujou rive (sòf si nou retade etap desandan an tou. anpil - Lè sa a, algorithm la pral ale "nan pèl"). Ak graf la nan erè a depann sou etap la iterasyon pa pral lis, men "saccadé".

1. Jenere done, mete etap la desandan gradyan

Aprantisaj machin san Python, Anaconda ak lòt reptil

2. Avèk seleksyon ki kòrèk la nan etap la desandan gradyan, nou fèt san pwoblèm epi byen vit rive nan minimòm la

Aprantisaj machin san Python, Anaconda ak lòt reptil

3. Si etap desandan gradyan an mal chwazi, nou depase maksimòm la, graf erè a se "saccadé", dirèksyon pran yon pi gwo kantite etap.

Aprantisaj machin san Python, Anaconda ak lòt reptil
и

Aprantisaj machin san Python, Anaconda ak lòt reptil

4. Si nou chwazi etap desandan gradyan an konplètman mal, nou deplase lwen minimòm la

Aprantisaj machin san Python, Anaconda ak lòt reptil

(Pou repwodui pwosesis la lè l sèvi avèk valè etap desandan gradyan yo montre nan foto yo, tcheke bwat "done referans").

Fichye a se nan lyen sa a, ou bezwen aktive makro, pa gen okenn viris.

Dapre kominote a respekte, èske yon senplifikasyon ak metòd pou prezante materyèl la akseptab? Èske li vo tradui atik la nan lang angle?

Sous: www.habr.com

Add nouvo kòmantè