Glèidheadh: mar a sgrìobh sinn innealan anailis toraidh stòr fosgailte ann am Python agus Pandas

Hi Habr. Tha an artaigil seo air a choisrigeadh do thoraidhean leasachadh ceithir-bliadhna air seata de dhòighean agus innealan airson a bhith a’ làimhseachadh slighean gluasad luchd-cleachdaidh ann an tagradh no air làrach-lìn. Ùghdar an leasachaidh - Maxim Godzi, a tha os cionn sgioba luchd-cruthachaidh toraidh agus a tha cuideachd na ùghdar air an artaigil. B’ e Glèidheadh ​​​​an t-ainm a bh’ air an toradh fhèin; tha e a-nis air a thionndadh gu bhith na leabharlann stòr fosgailte agus air a phostadh air Github gus an urrainn do dhuine sam bith a chleachdadh. Faodaidh seo uile a bhith inntinneach dhaibhsan a tha an sàs ann am mion-sgrùdadh toraidh is margaidheachd, adhartachadh agus leasachadh toraidh. Co-dhiù, air Habré chaidh artaigil fhoillseachadh mu thràth mu aon de na cùisean co-cheangailte ri bhith ag obair le Glèidhidh. Tha an stuth ùr a’ mìneachadh dè as urrainn don toradh agus mar a ghabhas a chleachdadh.

Às deidh dhut an artaigil a leughadh, bidh e comasach dhut do Glèidheadh ​​​​fhèin a sgrìobhadh, faodaidh e a bhith na dhòigh àbhaisteach airson a bhith a ’giullachd slighean luchd-cleachdaidh san tagradh agus nas fhaide air falbh, a’ toirt cothrom dhut feartan giùlain fhaicinn gu mionaideach agus seallaidhean fhaighinn às an seo airson fàs de slatan-tomhais gnìomhachais.

Dè a th’ ann an gleidheadh ​​agus carson a tha feum air?

An toiseach, b 'e ar n-amas a bhith a' gluasad Fàs Hacking bho shaoghal "buidseachd didseatach" gu saoghal àireamhan, anailisean agus ro-innsean. Mar thoradh air an sin, tha mion-sgrùdadh toraidh air a lughdachadh gu matamataig fìor-ghlan agus prògramadh dhaibhsan as fheàrr leotha àireamhan an àite sgeulachdan air leth, agus foirmlean gu faclan snasail mar “ath-bhranndadh”, “ath-shuidheachadh”, msaa, a tha breagha, ach ann an cleachdadh chan eil iad. cuidich mòran.

Gus na duilgheadasan sin fhuasgladh, bha feum againn air frèam airson anailisean tro ghrafaichean agus slighean, agus aig an aon àm leabharlann a bhios a’ sìmpleachadh cleachdaidhean àbhaisteach anailis, mar dhòigh air cunntas a thoirt air gnìomhan anailis toraidh cunbhalach a bhiodh furasta a thuigsinn do dhaoine agus innealan-fuadain. Tha an leabharlann a’ toirt comas cunntas a thoirt air giùlan luchd-cleachdaidh agus a cheangal ri meatrach gnìomhachas toraidh ann an cànan cho foirmeil agus cho soilleir is gu bheil e a’ sìmpleachadh agus a’ dèanamh fèin-ghluasad air gnìomhan àbhaisteach luchd-leasachaidh agus luchd-anailis, agus a’ comasachadh an conaltradh leis a’ ghnìomhachas.

Tha gleidheadh ​​​​na dhòigh agus innealan bathar-bog anailis a ghabhas atharrachadh agus amalachadh a-steach do thoradh didseatach (agus chan ann a-mhàin).

Thòisich sinn ag obair air an toradh ann an 2015. A-nis tha e na sheata innealan deiseil, ged nach eil fhathast air leth freagarrach airson a bhith ag obair le dàta ann am Python agus Pandas, modalan ionnsachaidh inneal le api coltach ri sklearn, innealan airson toraidhean eli5 agus modalan ionnsachaidh inneal cumadh a mhìneachadh.

Tha e uile air a phasgadh suas a-steach do leabharlann stòr fosgailte goireasach ann an stòr fosgailte Github - innealan glèidhidh. Chan eil e duilich an leabharlann a chleachdadh, faodaidh cha mhòr duine sam bith a tha dèidheil air mion-sgrùdadh toraidh, ach nach do sgrìobh còd roimhe, na dòighean sgrùdaidh againn a chuir an sàs anns an dàta aca leotha fhèin agus gun a bhith a’ caitheamh mòran ùine.

Uill, faodaidh prògramadair, neach-cruthachaidh tagradh, no ball de sgioba leasachaidh no deuchainn nach do rinn mion-sgrùdadh a-riamh roimhe tòiseachadh a ’cluich leis a’ chòd seo agus pàtrain fhaicinn ann a bhith a ’cleachdadh an aplacaid aca gun chuideachadh bhon taobh a-muigh.

Slighe cleachdaiche mar eileamaid bhunaiteach de mhion-sgrùdadh agus dòighean airson a ghiullachd

Is e slighe cleachdaiche sreath de stàitean luchd-cleachdaidh aig amannan sònraichte. A bharrachd air an sin, faodaidh tachartasan tighinn bho dhiofar stòran dàta, an dà chuid air-loidhne agus far-loidhne. Tha tachartasan a thachras don neach-cleachdaidh mar phàirt den t-slighe aige. Eisimpleirean:
• brùth am putan
• chunnaic mi dealbh
• bhuail an sgrion
• fhuair e post-d
• mhol e an toradh do charaid
• lìon am foirm
• tap air an sgrion
• sgrolaich
• chaidh e dhan àite-pàighidh
• burrito òrdachadh
• dh'ith iad burrito
• air a phuinnseanachadh le bhith ag ithe burrito
• a-steach don chafaidh bhon doras cùil
• a-steach bhon phrìomh dhoras
• lughdaich an tagradh
• fhuair sinn fios putaidh
• glaiste air an sgrion nas fhaide na X
• pàigheadh ​​airson an òrdugh
• shaor e an t-òrdugh
• chaidh iasad a dhiùltadh

Ma bheir thu dàta slighe buidheann de luchd-cleachdaidh agus ma nì thu sgrùdadh air mar a tha na h-eadar-ghluasadan ag obair, chì thu gu dìreach mar a tha an giùlan san tagradh air a thogail. Tha e goireasach seo a dhèanamh tro ghraf anns a bheil na stàitean nan nodan agus tha na h-eadar-ghluasadan eadar stàitean nan oirean:

Glèidheadh: mar a sgrìobh sinn innealan anailis toraidh stòr fosgailte ann am Python agus Pandas

Tha "Trajectory" na bhun-bheachd gu math goireasach - tha fiosrachadh mionaideach ann mu gach gnìomh neach-cleachdaidh, le comas dàta a bharrachd a chuir ris an tuairisgeul air na gnìomhan sin. Tha seo ga fhàgail na nì uile-choitcheann. Ma tha innealan brèagha agus goireasach agad a leigeas leat obrachadh le slighean, faodaidh tu rudan coltach a lorg agus an sgaradh.

Faodaidh sgaradh slighe a bhith a’ coimhead gu math toinnte an toiseach. Ann an suidheachadh àbhaisteach, tha seo fìor - feumaidh tu coimeas a dhèanamh eadar matrices ceangail no co-thaobhadh sreathan. Chaidh againn air dòigh nas fhasa a lorg - gus àireamh mhòr de shlighean a sgrùdadh agus an sgaradh tro chruinneachadh.

Mar a thionndaidh e a-mach, tha e comasach slighe a thionndadh gu puing a ’cleachdadh riochdachaidhean leantainneach, mar eisimpleir, TF-IDF. Às deidh a ’chruth-atharrachaidh, bidh an t-slighe gu bhith na phuing san fhànais, far a bheil an tachartas àbhaisteach ann an slighe diofar thachartasan agus eadar-ghluasadan eatorra air a dhealbhadh air na tuaghan. Faodar an rud seo bho àite mòr mìle agus barrachd meud (dimS = suim (seòrsaichean tachartais) + suim (ngrams_2 seòrsaichean)), a ro-mheasadh air plèana a’ cleachdadh TSNE. TSNE - cruth-atharrachadh, a 'lùghdachadh meud an fhànais gu 2 tuaghan agus, ma ghabhas e dèanamh, a' gleidheadh ​​​​na h-astaran coimeasach eadar puingean. Mar sin, bidh e comasach air mapa rèidh, mapa ro-mheasaidh figurative de shlighean, sgrùdadh a dhèanamh air mar a bha puingean diofar shlighean air an suidheachadh nam measg fhèin. Tha e air a mhion-sgrùdadh dè cho faisg no eadar-dhealaichte a bha iad air a chèile, co-dhiù a chruthaich iad cruinneachaidhean no sgapte air feadh a’ mhapa, msaa:

Glèidheadh: mar a sgrìobh sinn innealan anailis toraidh stòr fosgailte ann am Python agus Pandas

Tha innealan anailis gleidhidh a’ toirt comas dàta iom-fhillte agus slighean-slighe a thionndadh gu riochdachadh a ghabhas coimeas ri chèile, agus an uairsin sgrùdadh agus mìneachadh a dhèanamh air toradh a’ chruth-atharrachaidh.

A’ bruidhinn air modhan giullachd slighe àbhaisteach, tha sinn a’ ciallachadh trì prìomh innealan a chuir sinn an gnìomh ann an Glèidheadh ​​- grafaichean, matrices ceum agus mapaichean ro-mheasaidh slighe.

Tha a bhith ag obair le Google Analytics, Firebase agus siostaman anailis coltach ris gu math toinnte agus chan eil e 100% èifeachdach. Is e an duilgheadas grunn chuingealachaidhean don neach-cleachdaidh, agus mar thoradh air an sin tha obair an anailisiche ann an leithid de shiostaman an urra ri cliogan luchag agus taghadh sliseagan. Tha gleidheadh ​​​​ga dhèanamh comasach obrachadh le slighean luchd-cleachdaidh, agus chan ann a-mhàin le funail, mar ann an Google Analytics, far a bheil an ìre mion-fhiosrachaidh gu tric air a lughdachadh gu funail, ged a tha e air a thogail airson earrann sònraichte.

Glèidheadh ​​agus sgrùdaidhean cùise

Mar eisimpleir de bhith a 'cleachdadh an inneal leasaichte, is urrainn dhuinn iomradh a thoirt air cùis seirbheis sònraichte sònraichte anns an Ruis. Tha tagradh gluasadach Android aig a’ chompanaidh seo a tha mòr-chòrdte am measg luchd-ceannach. Bha an tionndadh bliadhnail bhon tagradh gluasadach timcheall air 7 millean rubles, bha caochlaidhean ràitheil eadar 60-130 mìle. Tha tagradh aig an aon chompanaidh cuideachd airson iOS, agus bha bile cuibheasach neach-cleachdaidh tagradh Apple nas àirde na a’ bhile cuibheasach de neach-dèiligidh a 'cleachdadh an aplacaid Android - 1080 rub. an aghaidh 1300 rub.

Cho-dhùin a 'chompanaidh àrdachadh èifeachdas an aplacaid Android, agus rinn iad mion-sgrùdadh mionaideach air. Chaidh grunn dhusan beachd-bharail a chruthachadh gus èifeachdas an tagraidh a mheudachadh. Às deidh dha Retentionneering a chleachdadh, thionndaidh e a-mach gu robh an duilgheadas anns na teachdaireachdan a chaidh a shealltainn do luchd-cleachdaidh ùr. Fhuair iad fiosrachadh mun bhrand, buannachdan companaidh agus prìsean. Ach, mar a thionndaidh e a-mach, bha còir aig na teachdaireachdan an neach-cleachdaidh a chuideachadh gus ionnsachadh mar a dh ’obraicheas e san tagradh.

Glèidheadh: mar a sgrìobh sinn innealan anailis toraidh stòr fosgailte ann am Python agus Pandas

Chaidh seo a dhèanamh, mar thoradh air an sin thòisich an tagradh air a dhubhadh às nas lugha, agus b 'e an àrdachadh ann an tionndadh gu òrdugh 23%. An toiseach, chaidh 20 sa cheud de thrafaig a-steach a thoirt don deuchainn, ach beagan làithean às deidh sin, às deidh dhaibh mion-sgrùdadh a dhèanamh air na ciad thoraidhean agus measadh a dhèanamh air a ’ghluasad, chuir iad air ais na cuibhreannan agus, air an làimh eile, dh’ fhàg iad 20 sa cheud airson a ’bhuidheann smachd, agus chuir iad air ais iad. ceithir fichead sa cheud anns an deuchainn. Seachdain às deidh sin, chaidh co-dhùnadh deuchainn dà bheachd-bheachd eile a chuir ris. Ann an dìreach seachd seachdainean, chaidh an tionndadh bhon tagradh Android suas aon uair gu leth an taca ris an ìre roimhe.

Ciamar a bhith ag obair le Retentioneering?

Tha na ciad cheumannan gu math sìmplidh - bidh sinn a’ luchdachadh an leabharlainn leis an àithne glèidhidh stàladh pìoba. Anns an stòr fhèin tha eisimpleirean deiseil agus cùisean giullachd dàta airson cuid de ghnìomhan anailis toraidh. Tha an seata air ùrachadh gu cunbhalach gus am bi e gu leòr airson a’ chiad neach-eòlais. Faodaidh a h-uile duine modalan deiseil a ghabhail agus sa bhad cuir an sàs anns na gnìomhan aca - leigidh seo leat pròiseas mion-sgrùdadh nas mionaidiche agus optimization slighean luchd-cleachdaidh a stèidheachadh cho luath agus cho èifeachdach sa ghabhas. Tha seo uile ga dhèanamh comasach pàtrain cleachdaidh tagraidh a lorg tro chòd a tha furasta a thuigsinn agus an t-eòlas seo a cho-roinn le co-obraichean.

Tha gleidheadh ​​​​na inneal as fhiach a chleachdadh fad beatha app, agus seo carson:

  • Tha gleidheadh ​​​​èifeachdach airson a bhith a’ lorg agus a’ dèanamh an fheum as fheàrr de shlighean luchd-cleachdaidh agus a’ leasachadh coileanadh gnìomhachais. Mar sin, bidh feartan ùra gu tric air an cur ri tagraidhean e-malairt, agus chan urrainnear a’ bhuaidh aca air an toradh a ro-innse ceart an-còmhnaidh. Ann an cuid de chùisean, tha cùisean co-chòrdalachd eadar feartan ùra is sean - mar eisimpleir, feadhainn ùra “cannibalize” feadhainn a th’ ann mar-thà. Agus anns an t-suidheachadh seo, tha feum air sgrùdadh cunbhalach air slighean.
  • Tha an suidheachadh coltach ri bhith ag obair le seanailean sanasachd: thathas an-còmhnaidh a’ dèanamh deuchainn air stòran trafaic ùra agus luchd-cruthachaidh sanasachd, feumar sùil a chumail air seusanachd, gluasadan agus buaidh thachartasan eile, a tha a’ leantainn gu nochdadh clasaichean ùra de dhuilgheadasan. Feumaidh e cuideachd sgrùdadh agus mìneachadh cunbhalach air meacanaig luchd-cleachdaidh.
  • Tha grunn nithean ann a tha daonnan a 'toirt buaidh air obrachadh an tagraidh. Mar eisimpleir, fiosan ùra bho luchd-leasachaidh: le bhith a’ dùnadh fìor dhuilgheadas, bidh iad gun fhiosta a’ tilleadh an t-seann fhear no a’ cruthachadh fear gu tur ùr. Thar ùine, bidh an àireamh de sgaoilidhean ùra a’ fàs, agus feumaidh am pròiseas lorg bhiteagan a bhith fèin-ghluasadach, a’ gabhail a-steach tro bhith a’ mion-sgrùdadh slighean luchd-cleachdaidh.

Gu h-iomlan, tha gleidheadh ​​​​na inneal èifeachdach. Ach chan eil crìoch air foirfeachd - faodar agus bu chòir a leasachadh, a leasachadh, agus toraidhean ùra fionnar a thogail air a bhunait. Mar as gnìomhaiche a bhios coimhearsnachd a’ phròiseict, mar as motha a bhios forc ann, nochdaidh roghainnean inntinneach ùra airson a chleachdadh.

Barrachd fiosrachaidh mu innealan gleidhidh:

Source: www.habr.com

Cuir beachd ann