Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

Mba, nke ọma, n'ezie, adịghị m egwu. A ghaghị inwe oke ókè ọ ga-ekwe omume ime ka isiokwu dị mfe. Ma maka ọkwa mbụ, ịghọta echiche ndị bụ isi na ngwa ngwa "ịbanye" isiokwu ahụ, ọ nwere ike ịnakwere. Anyị ga-atụle ka esi akpọ aha ihe a n'ụzọ ziri ezi (nhọrọ: "Machine learning for dummies", "Data analysis from diapers", "Algorithms for the small children") na njedebe.

Ruo n'ókè ahụ. Edere ọtụtụ mmemme ngwa na MS Excel maka nleba anya na ngosipụta anya nke usoro na-eme na usoro mmụta igwe dị iche iche mgbe ị na-enyocha data. Ịhụ bụ ikwere, ka emechara, dị ka ndị na-ebu omenala na-ekwu, bụ nke mepụtara ọtụtụ n'ime ụzọ ndị a (n'agbanyeghị, ọ bụghị ha niile. Ihe kachasị ike "igwe na-akwado vector", ma ọ bụ SVM, igwe na-akwado vector bụ ihe mepụtara nke na-emepụta ihe. Onye ibe anyị Vladimir Vapnik, Moscow Institute of Management. 1963, n'agbanyeghị! Ugbu a, Otú ọ dị, ọ na-akụzi ma na-arụ ọrụ na USA).

Faịlụ atọ maka nyocha

1. K-pụtara ụyọkọ

Nsogbu nke ụdị a na-ezo aka na "mmụta a na-achịkwaghị achịkwa," mgbe anyị kwesịrị ikesa data mbụ n'ime ọnụ ọgụgụ ụfọdụ nke a maara tupu oge eruo, mana anyị enweghị ọnụ ọgụgụ "azịza ziri ezi" ọ bụla; anyị ga-ewepụ ha na data ahụ n'onwe ya. . Nsogbu oge gboo bụ isi nke ịchọta ụdị nke ifuru iris (Ronald Fisher, 1936!), Nke a na-ewere dị ka akara mbụ nke ngalaba ihe ọmụma a, bụ naanị ụdị a.

Usoro dị nnọọ mfe. Anyị nwere ihe ndị egosipụtara dị ka vector (usoro nke ọnụọgụ N). Na irises, ndị a bụ ọnụọgụ nọmba 4 na-akọwa ifuru: ogologo na obosara nke lobes mpụta na n'ime nke perianth, n'otu n'otu (Fischer's irises - Wikipedia). A na-ahọrọ metrik Cartesian a na-emebu dị ka ebe dị anya, ma ọ bụ nha nso nso n'etiti ihe.

Na-esote, a na-ahọrọ ebe ụyọkọ na enweghị usoro (ma ọ bụ na-enweghị usoro, lee n'okpuru ebe a), a na-agbakọkwa ebe dị anya site na ihe ọ bụla gaa na ebe ụyọkọ. A na-akara ihe ọ bụla n'otu usoro nrụgharị dị ka nke etiti kacha nso. Mgbe ahụ, a na-ebufe etiti ụyọkọ nke ọ bụla na usoro mgbakọ na mwepụ nke nhazi nke ndị òtù ya (site na ntụnyere physics, a na-akpọkwa ya "center of mass"), a na-emegharị usoro ahụ ugboro ugboro.

Usoro na-agbakọta ngwa ngwa. Na foto na akụkụ abụọ ọ dị ka nke a:

1. Mbido nkesa ihe na-enweghị usoro na ụgbọ elu na ọnụ ọgụgụ nke ụyọkọ

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

2. Ikowa ebe ụyọkọ na ikenye isi na ụyọkọ ha

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

3. Na-ebufe ndị nhazi nke ụlọ ọrụ ụyọkọ, na-atụgharị njikọ nke isi ihe ruo mgbe ebe ahụ kwadoro. A na-ahụ trajectory nke ụyọkọ ụyọkọ na-aga n'ọnọdụ ikpeazụ ya.

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

N'oge ọ bụla, ị nwere ike ịtọ ebe ụyọkọ ọhụrụ (na-enweghị ịmepụta nkesa isi ihe ọhụrụ!) ma hụ na usoro nkewa anaghị adị mgbagwoju anya mgbe niile. Na mgbakọ na mwepụ, nke a pụtara na maka ọrụ a na-emeziwanye (nchikota nke squared anya site na isi na etiti nke ụyọkọ ha), anyị na-ahụ na ọ bụghị a zuru ụwa ọnụ, ma a obodo kacha nta. Enwere ike imeri nsogbu a ma ọ bụ site na nhọrọ na-abụghị nke usoro nchịkọta mbụ, ma ọ bụ site n'ịgụpụta ebe ndị nwere ike ime (mgbe ụfọdụ, ọ bara uru itinye ha kpọmkwem n'otu n'ime isi ihe, mgbe ahụ ọ dịkarịa ala enwere nkwa na anyị agaghị enweta ihe efu). ụyọkọ). N'ọnọdụ ọ bụla, set nke nwere njedebe na-enwekarị adịghị ike.

Ị nwere ike iji faịlụ a kpọọ na njikọ a (echefukwala ime ka nkwado macro nwee ike. enyochala faịlụ ndị ahụ maka nje virus)

Nkọwa nke usoro na Wikipedia - k-pụtara usoro

2. Mkpebi site na polynomials na ndakpọ data. Ntugharị

Ọka mmụta sayensị dị ịrịba ama na onye na-ewu ewu nke sayensị data K.V. Vorontsov kọwara n'ụzọ dị nkenke ụzọ mmụta igwe dị ka "sayensị nke ịbịaru ụzọ site n'isi ihe." N'ihe atụ a, anyị ga-ahụ ụkpụrụ dị na data site na iji usoro obere square.

E gosipụtara usoro nke kewaa data isi mmalite na "ọzụzụ" na "njikwa", yana ihe dị otú ahụ dị ka ịzụghachi azụ, ma ọ bụ "ịgbanweghachi" na data ahụ. Na nsoro ziri ezi, anyị ga-enwe njehie ụfọdụ na data ọzụzụ yana obere njehie buru ibu na data njikwa. Ọ bụrụ na ezighi ezi, ọ na-ebute ngbanwe ziri ezi na data ọzụzụ na nnukwu njehie na data ule.

(Ọ bụ ihe a maara nke ọma na site na isi N onye nwere ike ịdọrọ otu akụkụ nke ogo N-1th, na usoro a n'ozuzu ya adịghị enye nsonaazụ achọrọ. Lagrange interpolation polynomial na Wikipedia)

1. Tọọ nkesa mbụ

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

2. Anyị na-ekewa isi ihe na "ọzụzụ" na "njikwa" na nha nke 70 ruo 30.

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

3. Anyị na-adọta akụkụ dị nso n'akụkụ ebe ọzụzụ, anyị na-ahụ njehie ọ na-enye na data njikwa.

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

4. Anyị na-esetịpụ kpọmkwem usoro site na ebe ọzụzụ, anyị na-ahụkwa njehie dị egwu na data njikwa (na efu na data ọzụzụ, ma gịnị bụ isi ihe?).

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

E gosipụtara, n'ezie, bụ nhọrọ kachasị mfe na otu nkewa n'ime "ọzụzụ" na "njikwa" subsets; n'ozuzu, a na-eme nke a ọtụtụ oge maka nhazi kachasị mma nke ọnụọgụgụ.

Faịlụ a dị ebe a, nke antivirus nyochara ya. Kwado macros maka ịrụ ọrụ ziri ezi

3. Mmụdata gradient na mgbanwe mgbanwe njehie

A ga-enwe ikpe 4 akụkụ yana nkwụghachi azụ ahịrị. A ga-ekpebi ọnụọgụ regression linear site na nzọụkwụ site na iji usoro mgbada gradient, na mbụ ọnụọgụ niile bụ efu. Eserese dị iche na-egosi ike nke mbelata njehie ka a na-edozi ọnụọgụgụ karịa na nke ọma. Ọ ga-ekwe omume ilele amụma akụkụ abụọ akụkụ anọ niile.

Ọ bụrụ n’ịtọba nzọụkwụ mgbada gradient buru ibu, ị ga-ahụ na oge ọ bụla anyị ga-awụpụ opekempe wee rute nsonaazụ ya n'ọtụtụ usoro, n'agbanyeghị na n'ikpeazụ anyị ka ga-abata (ọ gwụla ma anyị gbuo oge mgbada ahụ kwa. ọtụtụ - mgbe ahụ algọridim ga-aga "na spades"). Na eserese nke njehie na-adabere na nzọụkwụ iteration agaghị adị mma, ma "jerky".

1. Mepụta data, tọọ nzọụkwụ mgbada gradient

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

2. Na nhọrọ ziri ezi nke gradient mgbada nzọụkwụ, anyị were were na ngwa ngwa iru kacha nta

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

3. Ọ bụrụ na gradient mgbada nzọụkwụ na-ezighị ahọrọ, anyị overshoot kacha, njehie graph bụ "jerky", convergence na-ewe a ibu ọnụ ọgụgụ nke nzọụkwụ.

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ
и

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

4. Ọ bụrụ na anyị họrọ usoro mgbada gradient kpamkpam na-ezighi ezi, anyị na-apụ na nke kacha nta

Ịmụ igwe na-enweghị Python, Anaconda na anụ ufe ndị ọzọ

(Iji megharịa usoro a site na iji ụkpụrụ nzọụkwụ gradient nke egosiri na foto a, lelee igbe “data ntụaka”).

Faịlụ dị na njikọ a, ịkwesịrị ịme ka macros rụọ ọrụ, enweghị nje.

Dị ka ndị obodo a na-akwanyere ùgwù si kwuo, ọ bụ ihe a na-anabata nke ọma na ime ka ihe dị mfe na ụzọ e si egosipụta ihe ahụ? Ọ bara uru ịsụgharị akụkọ ahụ na Bekee?

isi: www.habr.com

Tinye a comment