Idaduro: bawo ni a ṣe kọ awọn irinṣẹ orisun-ìmọ fun awọn atupale ọja ni Python ati Pandas

Hello, Habr. Nkan yii jẹ iyasọtọ si awọn abajade ti ọdun mẹrin ti idagbasoke ti ṣeto awọn ọna ati awọn irinṣẹ fun sisẹ awọn ipa ipa ọna olumulo ninu ohun elo tabi oju opo wẹẹbu kan. Onkọwe ti idagbasoke - Maxim Godzi, ti o ṣe olori ẹgbẹ ti awọn olupilẹṣẹ ọja ati pe o tun jẹ onkọwe ti nkan naa. Ọja naa funrararẹ ni a pe ni Retentioneering; Gbogbo eyi le jẹ anfani si awọn ti o ni ipa ninu ọja ati itupalẹ ọja, igbega ati idagbasoke ọja. Nipa ọna, lori Habré nkan kan ti ṣe atẹjade tẹlẹ nipa ọkan ninu awọn ọran ti ṣiṣẹ pẹlu Idaduro. Awọn ohun elo titun ṣe alaye ohun ti ọja le ṣe ati bi o ṣe le lo.

Lẹhin kika nkan naa, iwọ funrarẹ yoo ni anfani lati kọ Retentioneering tirẹ o le jẹ eyikeyi ọna ti o ni idiwọn fun sisẹ awọn itọpa olumulo ninu ohun elo ati ikọja, gbigba ọ laaye lati rii ni awọn alaye awọn abuda ti ihuwasi ati jade awọn oye lati inu eyi fun idagbasoke naa; ti awọn metiriki iṣowo.

Kini Retentioneering ati kilode ti o nilo?

Ibi-afẹde akọkọ wa ni lati gbe Sakasaka Growth lati agbaye ti “ajẹ oni-nọmba” si agbaye awọn nọmba, awọn atupale ati awọn asọtẹlẹ. Bi abajade, awọn atupale ọja ti dinku si mathimatiki mimọ ati siseto fun awọn ti o fẹran awọn nọmba dipo awọn itan ikọja, ati awọn agbekalẹ si awọn ọrọ buzzwords bi “rebranding”, “repositioning”, ati bẹbẹ lọ, eyiti o dun, ṣugbọn ni adaṣe ṣe iranlọwọ diẹ.

Lati yanju awọn iṣoro wọnyi, a nilo ilana kan fun awọn atupale nipasẹ awọn aworan ati awọn itọpa, ati ni akoko kanna ile-ikawe kan ti o rọrun awọn ilana atunnkanka aṣoju, gẹgẹbi ọna lati ṣe apejuwe awọn iṣẹ ṣiṣe itupalẹ ọja deede ti yoo jẹ oye fun eniyan mejeeji ati awọn roboti. Ile-ikawe naa n pese agbara lati ṣapejuwe ihuwasi olumulo ati sopọ mọ awọn metiriki iṣowo ọja ni iru ilana ati ede mimọ ti o rọrun ati adaṣe awọn iṣẹ ṣiṣe deede ti awọn olupilẹṣẹ ati awọn atunnkanka, ati irọrun ibaraẹnisọrọ wọn pẹlu iṣowo naa.

Idaduro jẹ ọna ati awọn irinṣẹ sọfitiwia itupalẹ ti o le ṣe deede ati ṣepọ si eyikeyi ọja oni-nọmba (kii ṣe nikan).

A bẹrẹ ṣiṣẹ lori ọja ni ọdun 2015. Bayi eyi jẹ ohun ti a ti ṣetan, botilẹjẹpe ko sibẹsibẹ bojumu, ṣeto awọn irinṣẹ ni Python ati Pandas fun ṣiṣẹ pẹlu data, awọn awoṣe ikẹkọ ẹrọ pẹlu sklearn-like api, awọn irinṣẹ fun itumọ awọn abajade ti awọn awoṣe ikẹkọ ẹrọ eli5 ati shap.

Gbogbo re ti di si ile-ikawe orisun ṣiṣi ti o rọrun ni ibi ipamọ Github ṣiṣi - awọn irinṣẹ idaduro. Lilo ile-ikawe naa ko nira;

O dara, olupilẹṣẹ kan, olupilẹṣẹ ohun elo, tabi ọmọ ẹgbẹ ti idagbasoke tabi ẹgbẹ idanwo ti ko ṣe awọn atupale tẹlẹ le bẹrẹ ṣiṣere pẹlu koodu yii ki o wo awọn ilana lilo ohun elo wọn laisi iranlọwọ ita.

Itọpa olumulo gẹgẹbi ipilẹ ipilẹ ti itupalẹ ati awọn ọna fun sisẹ rẹ

Itọpa olumulo jẹ lẹsẹsẹ awọn ipinlẹ olumulo ni awọn aaye akoko kan. Pẹlupẹlu, awọn iṣẹlẹ le wa lati oriṣiriṣi awọn orisun data, mejeeji lori ayelujara ati offline. Awọn iṣẹlẹ ti o ṣẹlẹ si olumulo jẹ apakan ti itọpa rẹ. Awọn apẹẹrẹ:
• te bọtini
• ri aworan naa
Lu iboju
• gba imeeli
• ṣeduro ọja naa si ọrẹ kan
• fọwọsi fọọmu naa
• ta iboju naa
• yi lọ
• lọ si owo iforukọsilẹ
• paṣẹ fun Burrito
• jẹ Burrito
• ni oloro nipa jijẹ burrito
• wọ inu kafe lati ẹnu-ọna ẹhin
Wọle lati ẹnu-ọna iwaju
O ti gbe ohun elo silẹ
• gba iwifunni titari
• ti di loju iboju to gun ju X
• san fun ibere
• ra ibere
• a kọ kọni

Ti o ba mu data itọpa ti ẹgbẹ kan ti awọn olumulo ati ṣe iwadi bii awọn iyipada ti wa ni tito, o le wa kakiri ni deede bi ihuwasi wọn ninu ohun elo ṣe jẹ eleto. O rọrun lati ṣe eyi nipasẹ aworan kan ninu eyiti awọn ipinlẹ jẹ awọn apa, ati awọn iyipada laarin awọn ipinlẹ jẹ awọn egbegbe:

Idaduro: bawo ni a ṣe kọ awọn irinṣẹ orisun-ìmọ fun awọn atupale ọja ni Python ati Pandas

“Itọpa” jẹ imọran irọrun pupọ - o ni alaye alaye nipa gbogbo awọn iṣe olumulo, pẹlu agbara lati ṣafikun eyikeyi data afikun si apejuwe awọn iṣe wọnyi. Eyi jẹ ki o jẹ ohun gbogbo agbaye. Ti o ba ni awọn irinṣẹ lẹwa ati irọrun ti o gba ọ laaye lati ṣiṣẹ pẹlu awọn itọpa, lẹhinna o le wa awọn afijq ati pin wọn.

Pipin itọpa le dabi idiju pupọ ni akọkọ. Ni ipo deede, eyi ni ọran - o nilo lati lo lafiwe matrix asopọ tabi tito lẹsẹsẹ. A ṣakoso lati wa ọna ti o rọrun - lati kawe nọmba nla ti awọn itọpa ati pin wọn nipasẹ ikojọpọ.

Bi o ti wa ni titan, o ṣee ṣe lati yi itọpa kan si aaye kan nipa lilo awọn aṣoju lilọsiwaju, fun apẹẹrẹ, TF-IDF. Lẹhin iyipada, itọpa naa di aaye kan ni aaye nibiti iṣẹlẹ deede ti awọn iṣẹlẹ oriṣiriṣi ati awọn iyipada laarin wọn ni itọpa ti wa ni igbero pẹlu awọn aake. Nkan yii lati ẹgbẹrun nla tabi aaye onisẹpo diẹ sii (dimS=apao(awọn iru iṣẹlẹ)+apao(awọn oriṣi ngrams_2)) le jẹ iṣẹ akanṣe sori ọkọ ofurufu ni lilo TSNE. TSNE jẹ iyipada ti o dinku iwọn aaye si awọn aake 2 ati, ti o ba ṣeeṣe, ṣe itọju awọn aaye ibatan laarin awọn aaye. Nitorinaa, o ṣee ṣe lori maapu alapin kan, maapu asọtẹlẹ apẹẹrẹ ti awọn itọpa, lati ṣe iwadi bii awọn aaye ti awọn ipa ọna oriṣiriṣi ṣe wa laarin ara wọn. O ṣe itupalẹ bawo ni wọn ṣe sunmọ tabi yatọ si ara wọn, boya wọn ṣẹda awọn iṣupọ tabi ti tuka kaakiri maapu naa, ati bẹbẹ lọ:

Idaduro: bawo ni a ṣe kọ awọn irinṣẹ orisun-ìmọ fun awọn atupale ọja ni Python ati Pandas

Awọn irinṣẹ atupale idaduro n pese agbara lati yi data eka ati awọn itọpa sinu wiwo ti o le ṣe afiwe pẹlu ara wọn, lẹhinna abajade iyipada le ṣe ayẹwo ati tumọ.

Nigbati on soro nipa awọn ọna boṣewa fun awọn itọpa sisẹ, a tumọ si awọn irinṣẹ akọkọ mẹta ti a ti ṣe imuse ni Idaduro - awọn aworan, awọn matiriki igbesẹ ati awọn maapu asọtẹlẹ itọpa.

Nṣiṣẹ pẹlu Awọn atupale Google, Firebase ati awọn ọna ṣiṣe atupale ti o jọra jẹ eka pupọ ati pe ko munadoko 100%. Iṣoro naa jẹ nọmba awọn ihamọ fun olumulo, nitori abajade eyi ti iṣẹ atunnkanka ni iru awọn ọna ṣiṣe da lori awọn jinna Asin ati yiyan awọn ege. Retentioneering mu ki o ṣee ṣe lati ṣiṣẹ pẹlu awọn itọpa olumulo, ki o si ko o kan pẹlu funnels, bi ni Google atupale, ibi ti awọn ipele ti apejuwe awọn ti wa ni igba dinku si a funnel, botilẹjẹ itumọ ti fun awọn kan awọn apa.

Retentioneering ati igba

Gẹgẹbi apẹẹrẹ ti lilo ohun elo ti o ni idagbasoke, a le ṣe apejuwe ọran ti iṣẹ onakan nla kan ni Russia. Ile-iṣẹ yii ni ohun elo alagbeka Android kan ti o jẹ olokiki laarin awọn alabara. Iyipada owo lododun lati inu ohun elo alagbeka jẹ nipa 7 milionu rubles, awọn iyipada akoko ti o wa lati 60-130 ẹgbẹrun onibara lilo ohun elo Android - 1080 rub. lodi si 1300 rubles.

Ile-iṣẹ pinnu lati mu iṣẹ ṣiṣe ti ohun elo Android pọ si, fun eyiti o ṣe itupalẹ pipe. Ọpọlọpọ awọn idawọle mejila ni a ti ipilẹṣẹ nipa jijẹ imunadoko ohun elo naa. Lẹhin lilo Retentionneering, o wa jade pe iṣoro naa wa ninu awọn ifiranṣẹ ti a fihan si awọn olumulo tuntun. Wọn gba alaye nipa ami iyasọtọ, awọn anfani ile-iṣẹ ati awọn idiyele. Ṣugbọn, bi o ti wa ni jade, awọn ifiranṣẹ yẹ ki o ran olumulo lọwọ lati kọ bi o ṣe le ṣiṣẹ ninu ohun elo naa.

Idaduro: bawo ni a ṣe kọ awọn irinṣẹ orisun-ìmọ fun awọn atupale ọja ni Python ati Pandas

Eyi ni a ṣe, bi abajade eyiti ohun elo naa di aifi sii, ati ilosoke ninu iyipada si aṣẹ jẹ 23%. Ni akọkọ, 20 ogorun ti ijabọ ti nwọle ni a fi fun idanwo naa, ṣugbọn lẹhin awọn ọjọ diẹ, lẹhin ti o ṣe ayẹwo awọn esi akọkọ ati ṣiṣe ayẹwo aṣa, wọn yi awọn iwọn pada ati, ni ilodi si, fi 20 ogorun silẹ fun ẹgbẹ iṣakoso, ati ọgọrin ogorun won gbe ni igbeyewo. Ni ọsẹ kan lẹhinna, a pinnu lati ṣafikun idanwo lẹsẹsẹ ti awọn idawọle meji diẹ sii. Ni ọsẹ meje nikan, iyipada lati ohun elo Android pọ si nipasẹ awọn akoko kan ati idaji ni akawe si ipele iṣaaju.

Bawo ni lati ṣiṣẹ pẹlu Retentioneering?

Awọn igbesẹ akọkọ jẹ ohun rọrun - ṣe igbasilẹ ile-ikawe pẹlu pipaṣẹ fifi sori ẹrọ pip. Ibi ipamọ funrararẹ ni awọn apẹẹrẹ ti a ti ṣetan ati awọn ọran ti sisẹ data fun diẹ ninu awọn iṣẹ ṣiṣe atupale ọja. Eto naa ti ni imudojuiwọn nigbagbogbo titi ti o fi to fun ojulumọ akọkọ. Ẹnikẹni le mu awọn modulu ti a ti ṣetan ati lẹsẹkẹsẹ lo wọn si awọn iṣẹ ṣiṣe wọn - eyi n gba wọn laaye lati ṣeto ilana lẹsẹkẹsẹ ti itupalẹ alaye diẹ sii ati iṣapeye ti awọn itọpa olumulo ni iyara ati daradara bi o ti ṣee. Gbogbo eyi jẹ ki o ṣee ṣe lati wa awọn ilana lilo ohun elo nipasẹ koodu mimọ ati pin iriri yii pẹlu awọn ẹlẹgbẹ.

Idaduro jẹ ohun elo ti o tọ lati lo jakejado igbesi aye ohun elo rẹ, ati pe idi niyi:

  • Idaduro jẹ doko fun titọpa ati imudara awọn itọpa olumulo nigbagbogbo ati ilọsiwaju iṣẹ iṣowo. Nitorinaa, awọn ẹya tuntun nigbagbogbo ni afikun si awọn ohun elo ecommerce, ipa eyiti o wa lori ọja ko le ṣe asọtẹlẹ ni deede. Ni awọn igba miiran, awọn iṣoro ibamu dide laarin awọn iṣẹ tuntun ati atijọ - fun apẹẹrẹ, awọn tuntun “cannibalize” awọn ti o wa tẹlẹ. Ati ni ipo yii, itupalẹ igbagbogbo ti awọn itọpa jẹ deede ohun ti o nilo.
  • Ipo naa jẹ iru nigbati o ba n ṣiṣẹ pẹlu awọn ikanni ipolowo: awọn orisun ijabọ titun ati awọn iṣelọpọ ipolowo ni idanwo nigbagbogbo, o jẹ dandan lati ṣe atẹle akoko, awọn aṣa ati ipa ti awọn iṣẹlẹ miiran, eyiti o yori si ifarahan ti awọn ipele titun ati siwaju sii ti awọn iṣoro. Eyi tun nilo ibojuwo igbagbogbo ati itumọ ti awọn ẹrọ olumulo.
  • Awọn ifosiwewe nọmba kan wa ti o ni ipa lori iṣẹ ṣiṣe ohun elo nigbagbogbo. Fun apẹẹrẹ, awọn idasilẹ tuntun lati ọdọ awọn olupilẹṣẹ: pipade iṣoro lọwọlọwọ, wọn dapada atijọ pada lairotẹlẹ tabi ṣẹda tuntun patapata. Ni akoko pupọ, nọmba awọn idasilẹ tuntun n dagba, ati ilana ti awọn aṣiṣe ipasẹ nilo lati jẹ adaṣe, pẹlu nipasẹ itupalẹ awọn itọpa olumulo.

Iwoye, Idaduro jẹ ohun elo ti o munadoko. Ṣugbọn ko si opin si pipe - o le ati pe o yẹ ki o ni ilọsiwaju, idagbasoke, ati awọn ọja tutu titun ti a ṣe lori ipilẹ rẹ. Bi agbegbe iṣẹ akanṣe naa ṣe n ṣiṣẹ diẹ sii, awọn orita diẹ sii yoo wa, ati awọn aṣayan iwunilori tuntun fun lilo yoo han.

Alaye diẹ sii nipa awọn irinṣẹ Idaduro:

orisun: www.habr.com

Fi ọrọìwòye kun