Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

Ní hea, ar ndóigh, nílim dáiríre. Ní mór teorainn a bheith leis an méid is féidir ábhar a shimpliú. Ach do na chéad chéimeanna, tuiscint a fháil ar bhunchoincheapa agus “dul isteach” go tapa ar an topaic, d’fhéadfadh sé a bheith inghlactha. Déanfaimid plé ar conas an t-ábhar seo a ainmniú i gceart (roghanna: "Meaisín foghlama do dummies", "anailís sonraí ó diapers", "Algartam do na cinn bheaga") ag an deireadh.

Go dtí an pointe. Scríobh roinnt clár feidhmchláir in MS Excel le haghaidh léirshamhlú agus léiriú amhairc ar phróisis a tharlaíonn ar mhodhanna éagsúla meaisínfhoghlama agus anailís á déanamh ar shonraí. Is é Seeing a chreidiúint, tar éis an tsaoil, mar a deir iompróirí an chultúir, a d'fhorbair an chuid is mó de na modhanna seo (dála an scéil, ní léir iad. Is é an "meaisín veicteoir tacaíochta" is cumhachtaí, nó SVM, meaisín veicteoir tacaíochta an aireagán. ár gcomhghleacaí Vladimir Vapnik, Institiúid Bainistíochta Moscó, 1963, dála an scéil! Anois, áfach, múineann sé agus oibríonn sé i SAM).

Trí chomhad le haghaidh athbhreithnithe

1. K-ciallaíonn cnuasú

Tagraíonn fadhbanna den chineál seo do “foghlaim gan mhaoirseacht,” nuair is gá dúinn na sonraí tosaigh a roinnt i líon áirithe catagóirí atá ar eolas roimh ré, ach níl aon líon “freagraí cearta” againn; ní mór dúinn iad a bhaint as na sonraí féin. . Is í an bhunfhadhb chlasaiceach a bhaineann le teacht ar fhospeicis de bhláthanna inteachán (Ronald Fisher, 1936!), a mheastar an chéad chomhartha den réimse eolais seo, den chineál seo amháin.

Tá an modh simplí go leor. Tá tacar réad againn a léirítear mar veicteoirí (tacair N uimhreacha). In irises, is iad seo tacair de 4 uimhreacha arb iad is sainairíonna iad an bláth: fad agus leithead lobes seachtrach agus inmheánach an perianth, faoi seach (Irisí Fischer - Vicipéid). Roghnaítear an ghnáthmhéadracht Chairtéiseach mar an t-achar, nó an tomhas gaireachta idir réada.

Ansin, roghnaítear ionaid bhraisle go randamach (nó ní randamach, féach thíos), agus ríomhtar na faid ó gach réad go dtí na lárionaid bhraisle. Marcáiltear gach réad ag céim atrialach ar leith mar rud a bhaineann leis an lárionad is gaire. Ansin aistrítear lár gach braisle go meán uimhríochtúil chomhordanáidí a bhall (de réir analaí leis an bhfisic, tugtar “lár na maise” air freisin), agus déantar an nós imeachta arís agus arís eile.

Tagann an próiseas le chéile go tapa go leor. Breathnaíonn sé mar seo i bpictiúir in dhá thoise:

1. Dáileadh randamach tosaigh na bpointí ar an eitleán agus líon na gcnuasach

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

2. Lárionaid bhraisle a shonrú agus pointí a shannadh dá gcnuasaigh

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

3. Comhordanáidí na n-ionad braisle a aistriú, ag athríomh cleamhnú na bpointí go dtí go mbeidh na hionaid chobhsaithe. Tá trajectory an ionaid bhraisle ag bogadh go dtí a suíomh deiridh le feiceáil.

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

Ag am ar bith, is féidir leat cnuas-ionaid nua a shocrú (gan dáileadh nua pointí a ghiniúint!) agus a fheiceáil nach mbíonn an próiseas deighilte gan athbhrí i gcónaí. Go matamaiticiúil, ciallaíonn sé seo nach bhfaighimid íosmhéid domhanda, ach íosmhéid áitiúil, don fheidhm atá á barrfheabhsú (suim na n-achar cearnacha ó phointí go lár a gcnuasach). Is féidir an fhadhb seo a shárú trí rogha neamhrandamach ar lárionaid tosaigh, nó trí ionaid fhéideartha a áireamh (uaireanta tá sé buntáiste iad a chur go díreach ag ceann de na pointí, ansin ar a laghad tá ráthaíocht ann nach bhfágfaimid folamh. cnuasaigh). In aon chás, tá infimum i gcónaí ag sraith críochta.

Is féidir leat imirt leis an gcomhad seo ag an nasc seo (ná déan dearmad tacaíocht mhacra a chumasú. Scanadh na comhaid le haghaidh víreas)

Cur síos ar an modh ar Vicipéid - k-ciallaíonn modh

2. Comhfhogasú de réir iltéarmaí agus miondealú sonraí. Athoiliúint

Eolaí iontach agus tóir ar eolaíocht sonraí K.V. Déanann Vorontsov cur síos achomair ar mhodhanna meaisínfhoghlama mar “eolaíocht a bhaineann le cuair a tharraingt trí phointí.” Sa sampla seo, gheobhaidh muid patrún sna sonraí ag baint úsáide as an modh is lú cearnóga.

Taispeántar an teicníc ina roinnfear na sonraí foinse ina “oiliúint” agus ina “rialú”, chomh maith le feiniméan mar athoiliúint, nó “athchoigeartú” ar na sonraí. Le comhfhogasú ceart, beidh earráid áirithe againn ar na sonraí oiliúna agus earráid beagán níos mó ar na sonraí rialaithe. Má tá sé mícheart, déantar coigeartú beacht ar na sonraí oiliúna agus earráid mhór ar na sonraí tástála mar thoradh air.

(Is fíric aitheanta é gur féidir le duine cuar amháin den N-1ú céim a tharraingt trí phointí N, agus ní thugann an modh seo sa chás ginearálta an toradh inmhianaithe. Idirshuíomh Lagrange polynomial ar Vicipéid)

1. Socraigh an dáileadh tosaigh

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

2. Roinnimid na pointí idir “oiliúint” agus “rialú” i gcóimheas 70 go 30.

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

3. Tarraingímid an cuar comhfhogasaithe feadh na bpointí oiliúna, feicimid an earráid a thugann sé ar na sonraí rialaithe

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

4. Tarraingímid cuar cruinn trí na pointí oiliúna, agus feicimid earráid monstrous ar na sonraí rialaithe (agus nialas ar na sonraí oiliúna, ach cad é an pointe?).

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

Léirítear, ar ndóigh, an rogha is simplí le roinnt amháin i bhfo-thacair “oiliúna” agus “rialaithe”; sa chás ginearálta, déantar é seo go minic chun na comhéifeachtaí a choigeartú is fearr.

Tá an comhad ar fáil anseo, arna scanadh ag frithvíreas. Cumasaigh macraí le haghaidh oibriú ceart

3. Ghinealach grádáin agus dinimic an athraithe earráide

Beidh cás 4thoiseach agus aischéimniú líneach ann. Cinnfear comhéifeachtaí aischéimniúcháin líneacha céim ar chéim ag baint úsáide as modh an shliocht grádáin, ar dtús tá na comhéifeachtaí go léir nialasach. Taispeánann graf ar leith dinimic an laghdaithe earráide de réir mar a choigeartaítear na comhéifeachtaí níos cruinne agus níos cruinne. Is féidir na ceithre réamh-mheastachán déthoiseacha a fheiceáil.

Má shocraíonn tú céim shliocht an ghrádáin ró-mhór, feicfidh tú go scipfimid an t-íosmhéid gach uair agus go sroichfimid an toradh i líon níos mó céimeanna, cé go sroichfimid fós sa deireadh (mura gcuirfimid moill ar an gcéim shliocht freisin. i bhfad - ansin beidh an algartam dul "i rámhainní"). Agus ní bheidh graf na hearráide ag brath ar an gcéim atriallta réidh, ach "jerky".

1. Gin sonraí, socraigh an chéim shliocht grádán

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

2. Le roghnú ceart an chéim shliocht grádán, sroicheann muid go réidh agus go tapa an t-íosmhéid

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

3. Má roghnaítear céim shliocht an ghrádáin go mícheart, déanaimid ró-roghnú ar an uasmhéid, tá an graf earráide "jerky", tógann an chóineasú líon níos mó céimeanna

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile
и

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

4. Má roghnaíonn muid an chéim shliocht grádán go hiomlán mícheart, bogaimid ar shiúl ón íosmhéid

Foghlaim meaisín gan Python, Anaconda agus reiptílí eile

(Chun an próiseas a atáirgeadh ag baint úsáide as na luachanna céim shliocht grádáin a thaispeántar sna pictiúir, seiceáil an bosca "sonraí tagartha").

Tá an comhad ag an nasc seo, ní mór duit Macraí a chumasú, níl aon víris ann.

Dar leis an bpobal meas, an bhfuil a leithéid de shimpliú agus modh cur i láthair an ábhair inghlactha? An fiú an t-alt a aistriú go Béarla?

Foinse: will.com

Add a comment