Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

Chan e, uill, gu dearbh, chan eil mi trom. Feumaidh crìoch a bhith air an ìre gu bheil e comasach cuspair a dhèanamh nas sìmplidhe. Ach airson na ciad ìrean, a 'tuigsinn bun-bheachdan bunaiteach agus gu luath "a-steach" a' chuspair, dh'fhaodadh gum bi e iomchaidh. Bruidhnidh sinn mu mar a dh'ainmicheas tu an stuth seo gu ceart (roghainnean: "Inneal ionnsachadh airson dummies", "Mion-sgrùdadh dàta bho diapers", "Algorithms airson an fheadhainn bheaga") aig an deireadh.

Chun a 'phuing. Sgrìobh mi grunn phrògraman tagraidh ann an MS Excel airson fradharc agus riochdachadh lèirsinneach de phròiseasan a tha a’ tachairt ann an diofar dhòighean ionnsachaidh inneal nuair a thathar a’ dèanamh anailis air dàta. Tha faicinn a’ creidsinn, às deidh a h-uile càil, mar a tha luchd-giùlain a’ chultair ag ràdh, a leasaich a’ mhòr-chuid de na dòighean sin (co-dhiù, chan e a h-uile gin dhiubh. ar companach Vladimir Vapnik, Institiud Riaghlaidh Moscow. 1963, co-dhiù! A-nis, ge-tà, tha e a’ teagasg agus ag obair anns na SA).

Trì faidhlichean airson ath-sgrùdadh

1. K-a 'ciallachadh braiseadh

Tha duilgheadasan den t-seòrsa seo a’ toirt iomradh air “ionnsachadh gun stiùireadh,” nuair a dh’ fheumas sinn an dàta tùsail a roinn ann an àireamh sònraichte de roinnean a tha aithnichte ro-làimh, ach chan eil àireamh sam bith de “freagairtean ceart” againn; feumaidh sinn an toirt a-mach às an dàta fhèin . Tha an duilgheadas clasaigeach bunaiteach ann a bhith a’ lorg fo-ghnè de fhlùraichean iris (Ronald Fisher, 1936!), A tha air a mheas mar a’ chiad shoidhne den raon eòlais seo, dìreach mar seo.

Tha an dòigh-obrach gu math sìmplidh. Tha seata de nithean againn air an riochdachadh mar vectaran (seata de N àireamhan). Ann an irises, is iad seo seataichean de 4 àireamhan a tha a 'comharrachadh an fhlùr: fad agus leud lobes a-muigh agus a-staigh an perianth, fa leth (Irisean Fischer - Wikipedia). Tha an meatrach àbhaisteach Cartesianach air a thaghadh mar an astar, no an tomhas de cho faisg eadar nithean.

An uairsin, thèid ionadan brabhsair a thaghadh air thuaiream (no chan ann air thuaiream, faic gu h-ìosal), agus tha na h-astaran bho gach nì gu na h-ionadan brabhsair air an tomhas. Tha gach nì aig ceum ath-aithris sònraichte air a chomharrachadh mar a bhuineas don ionad as fhaisge. An uairsin tha meadhan gach brabhsair air a ghluasad gu meadhan àireamhachd co-chomharran a bhuill (le samhlachas le fiosaig, canar “meadhan tomad”) ris cuideachd, agus thèid am modh-obrach ath-aithris.

Bidh am pròiseas a 'tighinn còmhla gu math luath. Ann an dealbhan ann an dà mheud tha e a’ coimhead mar seo:

1. An toiseach cuairteachadh air thuaiream de phuingean air a' phlèana agus an àireamh de chlàran

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

2. A 'sònrachadh ionadan cnuasachaidh agus a' sònrachadh phuingean dha na cruinneachaidhean aca

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

3. A 'gluasad co-chomharran nan ionadan brabhsair, ag ath-àireamhachadh ceangal nam puingean gus am bi na h-ionadan seasmhach. Tha slighe an ionaid bhrais a’ gluasad chun t-suidheachadh mu dheireadh aige ri fhaicinn.

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

Aig àm sam bith, faodaidh tu ionadan brabhsair ùra a shuidheachadh (gun a bhith a’ gineadh cuairteachadh ùr de phuingean!) Agus faic nach eil am pròiseas sgaradh an-còmhnaidh gun teagamh. Gu matamataigeach, tha seo a’ ciallachadh, airson an gnìomh a bhith air a mheudachadh (suim nan astaran ceàrnagach bho phuingean gu ionadan nan cruinneachaidhean aca), nach lorg sinn ìre chruinneil, ach ìre ionadail. Faodar faighinn seachad air an duilgheadas seo an dàrna cuid le roghainn neo-thuairmeasach de ionadan cnuasachaidh tùsail, no le bhith ag àireamhachadh ionadan a dh’ fhaodadh a bhith ann (uaireannan tha e buannachdail an cur dìreach aig aon de na puingean, agus an uairsin co-dhiù tha gealltanas ann nach fhaigh sinn falamh. cnuasaichean). Ann an suidheachadh sam bith, bidh seata chrìochnaichte an-còmhnaidh infimum.

Faodaidh tu cluich leis an fhaidhle seo aig a’ cheangal seo (na dìochuimhnich taic macro a chur an comas. Chaidh na faidhlichean a sganadh airson bhìorasan)

Tuairisgeul air an dòigh air Wikipedia - k-a 'ciallachadh modh

2. Tuairmse le polynomials agus briseadh dàta. Ath-thrèanadh

Neach-saidheans iongantach agus mòr-chòrdte ann an saidheans dàta K.V. Tha Vorontsov a’ toirt cunntas goirid air dòighean ionnsachaidh inneal mar “an saidheans mu bhith a’ tarraing chromagan tro phuingean.” San eisimpleir seo, lorgaidh sinn pàtran anns an dàta a’ cleachdadh an dòigh as lugha de cheàrnagan.

Tha an dòigh air an dàta tùsail a roinn ann an “trèanadh” agus “smachd” air a shealltainn, a bharrachd air iongantas mar ath-thrèanadh, no “ath-atharrachadh” air an dàta. Le tuairmseachadh ceart, bidh mearachd sònraichte againn air an dàta trèanaidh agus mearachd beagan nas motha air an dàta smachd. Ma tha e ceàrr, bidh e a’ leantainn gu atharrachadh mionaideach air an dàta trèanaidh agus mearachd mòr air an dàta deuchainn.

(Tha e aithnichte gu bheil tro phuingean N comasach air aon lùb den ìre N-1mh a tharraing, agus chan eil an dòigh seo sa chùis choitcheann a’ toirt seachad an toradh a tha thu ag iarraidh. Polynomial eadar-roinn Lagrange air Wikipedia)

1. Suidhich an sgaoileadh tòiseachaidh

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

2. Bidh sinn a 'roinn na puingean gu "trèanadh" agus "smachd" ann an co-mheas de 70 gu 30.

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

3. Bidh sinn a 'tarraing an lùb tuairmseach air na puingean trèanaidh, chì sinn a' mhearachd a bheir e seachad air an dàta smachd

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

4. Bidh sinn a’ tarraing lùb cruinn tro na puingean trèanaidh, agus chì sinn mearachd monstrous air an dàta smachd (agus neoni air an dàta trèanaidh, ach dè a’ phuing?).

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

Air a shealltainn, gu dearbh, tha an roghainn as sìmplidh le aon roinn ann an "trèanadh" agus "smachd" fo-roinnean; anns a 'chùis choitcheann, tha seo air a dhèanamh iomadh uair airson an atharrachadh as fheàrr de na co-èifeachdan.

Tha am faidhle ri fhaighinn an seo, air a sganadh le antivirus. Dèan comas air macros airson obrachadh ceart

3. Teàrnadh caisead agus dinamics atharrachadh mearachd

Bidh cùis 4-mheudach ann agus ais-thionndadh sreathach. Thèid co-èifeachdan ais-tharraing sreathach a dhearbhadh ceum air cheum a’ cleachdadh an dòigh teàrnadh caisead, an toiseach tha a h-uile co-èifeachd neoni. Tha graf air leth a’ sealltainn daineamaigs lughdachadh mhearachdan leis gu bheil na co-èifeachdan air an atharrachadh barrachd is nas cinntiche. Tha e comasach na ceithir ro-mheasaidhean dà-mheudach fhaicinn.

Ma shuidhicheas tu an ceum teàrnaidh caisead ro mhòr, chì thu gum bi sinn a’ leum air an ìre as ìsle a h-uile uair agus gun ruig sinn an toradh ann an àireamh nas motha de cheumannan, ged a ruigeas sinn aig a’ cheann thall (mura cuir sinn dàil air a’ cheum teàrnaidh cuideachd mòran - an uairsin thèid an algairim “ann an spaidean”). Agus cha bhi graf na mearachd a rèir a’ cheum ath-aithris rèidh, ach “jerky”.

1. Cruthaich dàta, suidhich an ceum teàrnaidh caisead

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

2. Le taghadh ceart de cheum teàrnaidh caisead, bidh sinn gu rèidh agus gu luath a 'ruigsinn an ìre as ìsle

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

3. Ma tha an ceum teàrnaidh caisead air a thaghadh gu ceàrr, bidh sinn a’ dol thairis air an ìre as àirde, tha an graf mearachd “jerky”, bidh co-ghluasad a’ gabhail àireamh nas motha de cheumannan

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile
и

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

4. Ma thaghas sinn an ceum teàrnaidh caisead gu tur ceàrr, gluaisidh sinn air falbh bhon ìre as ìsle

Ionnsachadh innealan às aonais Python, Anaconda agus snàgairean eile

(Gus am pròiseas ath-riochdachadh a’ cleachdadh na luachan ceum teàrnaidh caisead a chithear anns na dealbhan, thoir sùil air a’ bhogsa “dàta iomraidh”).

Tha am faidhle aig a’ cheangal seo, feumaidh tu macros a chomasachadh, chan eil bhìorasan ann.

A rèir na coimhearsnachd cliùiteach, a bheil an leithid de shìmpleachadh agus dòigh air an stuth a thaisbeanadh iomchaidh? An fhiach an artaigil eadar-theangachadh gu Beurla?

Source: www.habr.com

Cuir beachd ann