Coinneáil: conas a scríobhamar uirlisí foinse oscailte le haghaidh anailíse táirgí i Python agus Pandas

Dia duit, Habr. Tá an t-alt seo dírithe ar thorthaí ceithre bliana d'fhorbairt sraith modhanna agus uirlisí chun conairí gluaiseachta úsáideoirí a phróiseáil in iarratas nó ar shuíomh Gréasáin. Údar na forbartha - Maxim Godzi, atá i gceannas ar fhoireann na cruthaitheoirí táirgí agus is údar an ailt freisin. Coinneáil a tugadh ar an táirge féin; tá sé aistrithe anois go leabharlann foinse oscailte agus postáilte ar Github ionas gur féidir le haon duine é a úsáid. D'fhéadfadh sé seo go léir a bheith ina ábhar spéise dóibh siúd a bhfuil baint acu le hanailís táirgí agus margaíochta, cur chun cinn agus forbairt táirgí. Dála an scéil, ar Habré Foilsíodh alt cheana féin faoi cheann de na cásanna a bhaineann le hobair le Coinneáil. Míníonn an t-ábhar nua cad is féidir leis an táirge a dhéanamh agus conas is féidir é a úsáid.

Tar éis duit an t-alt a léamh, beidh tú féin in ann do Choinneáil féin a scríobh; is féidir é a bheith ina mhodh caighdeánaithe chun ruthag úsáideoirí san fheidhmchlár agus ina dhiaidh sin a phróiseáil, rud a ligeann duit saintréithe iompair a fheiceáil go mion agus léargais a bhaint as seo don fhás de mhéadracht ghnó.

Cad is Coinneáil ann agus cén fáth a bhfuil gá leis?

Ba é an sprioc a bhí againn ar dtús an Hacaáil Fáis a aistriú ó dhomhan na “heasachta digiteacha” go dtí saol na n-uimhreacha, na hanailíse agus na réamhaisnéisí. Mar thoradh air sin, laghdaítear anailísí táirgí go matamaitic íon agus ríomhchlárú dóibh siúd ar fearr leo uimhreacha in ionad scéalta iontacha, agus foirmlí go focail bhuí cosúil le “athbhrandáil”, “athshuíomh”, srl., rud a fhuaimníonn go deas, ach i ndáiríre is beag a chabhraíonn leo.

Chun na fadhbanna seo a réiteach, bhí gá againn le creat don anailísíocht trí ghraif agus conairí, agus ag an am céanna leabharlann a shimplíonn gnáthaimh anailísithe tipiciúla, mar bhealach chun cur síos a dhéanamh ar thascanna rialta anailíse táirge a bheadh ​​intuigthe do dhaoine agus do róbait. Soláthraíonn an leabharlann an cumas chun cur síos a dhéanamh ar iompraíocht úsáideoirí agus é a nascadh le méadracht gnó táirgí i dteanga chomh foirmiúil agus chomh soiléir sin go ndéanann sí simplíocht agus uathoibriú gnáththascanna forbróirí agus anailísithe, agus éascaíonn sé a gcumarsáid leis an ngnó.

Is modh agus uirlisí bogearraí anailíse é coinneáil is féidir a oiriúnú agus a chomhtháthú in aon táirge digiteach (agus ní amháin).

Thosaigh muid ag obair ar an táirge i 2015. Anois is sraith uirlisí réidh é seo, cé nach bhfuil sé idéalach fós, i Python agus Pandas chun oibriú le sonraí, samhlacha meaisínfhoghlama le api cosúil le sklearn, uirlisí chun torthaí na múnlaí meaisínfhoghlama eli5 agus shap a léirmhíniú.

Tá sé fillte suas ar fad chuig leabharlann foinse oscailte áisiúil i stór oscailte Github - uirlisí coinneála. Níl sé deacair an leabharlann a úsáid; is féidir le beagnach aon duine a bhfuil grá aige d’anailísíocht táirgí, ach nach bhfuil cód scríofa aige roimhe seo, ár modhanna anailíse a chur i bhfeidhm ar a gcuid sonraí go neamhspleách agus gan infheistíocht shuntasach ama.

Bhuel, is féidir le ríomhchláraitheoir, cruthaitheoir feidhmchlár, nó ball d’fhoireann forbartha nó tástála nach bhfuil anailísíocht déanta riamh roimhe seo tosú ag imirt leis an gcód seo agus patrúin úsáide a bhfeidhmchláir a fheiceáil gan chabhair sheachtrach.

Trajectory úsáideora mar ghné bhunúsach den anailís agus modhanna chun é a phróiseáil

Is seicheamh de stáit úsáideoirí ag pointí ama áirithe é trajectory úsáideora. Ina theannta sin, is féidir le himeachtaí teacht ó fhoinsí sonraí éagsúla, ar líne agus as líne araon. Tá imeachtaí a tharlaíonn don úsáideoir mar chuid dá ruthag. Samplaí:
• brúitear an cnaipe
• chonaic an pictiúr
• buail an scáileán
• fuair sé ríomhphost
• mhol an táirge do chara
• an fhoirm a líonadh
• tapáil an scáileán
• scrofa
• chuaigh go dtí an clár airgid
• d'ordaigh sé burrito
• d'ith sé burrito
• fuair tú nimh trí burrito a ithe
• isteach sa chaifé ón mbealach isteach cúil
• isteach ón mbealach isteach tosaigh
• an t-iarratas a íoslaghdú
• fógra brú a fháil
• bhí sé greamaithe ar an scáileán níos faide ná X
• d'íoc as an ordú
• cheannaigh an t-ordú
• diúltaíodh iasacht

Má ghlacann tú sonraí conaire grúpa úsáideoirí agus má dhéanann tú staidéar ar an gcaoi a ndéantar trasdulta a struchtúrú, is féidir leat a rianú go beacht conas a struchtúraítear a n-iompraíocht san fheidhmchlár. Tá sé áisiúil é seo a dhéanamh trí ghraf inar nóid iad stáit, agus gur imill iad trasdulta idir stáit:

Coinneáil: conas a scríobhamar uirlisí foinse oscailte le haghaidh anailíse táirgí i Python agus Pandas

Is coincheap an-áisiúil é "Trajectory" - tá faisnéis mhionsonraithe ann faoi gach gníomh úsáideora, agus an cumas aon sonraí breise a chur leis an gcur síos ar na gníomhartha seo. Déanann sé seo réad uilíoch. Má tá uirlisí álainn agus áisiúla agat a ligeann duit oibriú le ruthag, ansin is féidir leat cosúlachtaí a aimsiú agus iad a dheighilt.

D’fhéadfadh deighilt trajectory a bheith an-chasta ar dtús. I gcás gnáth, is é seo an cás - ní mór duit comparáid a dhéanamh maitrís nascachta nó ailíniú seicheamh a úsáid. D'éirigh linn teacht ar bhealach níos simplí - staidéar a dhéanamh ar líon mór conairí agus iad a dheighilt trí bhraisliú.

Mar a tharla sé, is féidir trajectory a iompú ina phointe ag baint úsáide as léirithe leanúnacha, mar shampla, TF-IDF. Tar éis an chlaochlaithe, éiríonn an trajectory mar phointe sa spás ina ndéantar tarlú normalaithe imeachtaí éagsúla agus trasdulta eatarthu sa chonair a bhreacadh feadh na haiseanna. Is féidir an rud seo ó mhíle ollmhór nó níos mó spáis tríthoiseach (dimS = sum (cineálacha imeachtaí) + suim (ngrams_2 cineálacha)) a theilgean ar eitleán ag úsáid TSNE. Is claochlú é TSNE a laghdaíonn toise an spáis go 2 ais agus, más féidir, a chaomhnaíonn na faid choibhneasta idir pointí. Dá réir sin, éiríonn sé indéanta ar léarscáil chomhréidh, léarscáil teilgean fíorach de ruthag, staidéar a dhéanamh ar an gcaoi a raibh pointí na ruthag éagsúil suite eatarthu féin. Déanann sé anailís ar cé chomh gar nó éagsúil a bhí siad dá chéile, cibé acu an raibh siad ina gcnuasaigh nó an raibh siad scaipthe trasna na léarscáile, etc.:

Coinneáil: conas a scríobhamar uirlisí foinse oscailte le haghaidh anailíse táirgí i Python agus Pandas

Soláthraíonn uirlisí anailísíochta coinneála an cumas sonraí casta agus conairí casta a iompú ina radharc ar féidir iad a chur i gcomparáid lena chéile, agus ansin is féidir toradh an chlaochlaithe a scrúdú agus a léirmhíniú.

Ag labhairt faoi mhodhanna caighdeánacha chun conairí a phróiseáil, is éard atá i gceist againn ná trí phríomhuirlisí atá curtha i bhfeidhm againn sa Choinneáil - graif, maitrísí céime agus léarscáileanna teilgin conaire.

Tá oibriú le Google Analytics, Firebase agus córais anailíse comhchosúla casta go leor agus níl sé 100% éifeachtach. Is é an fhadhb atá ann ná roinnt srianta don úsáideoir, agus mar thoradh air sin braitheann obair an anailísí i gcórais den sórt sin ar cad a tharlaíonn nuair luiche agus roghnú slisní. Fágann coinneáil gur féidir oibriú le conairí úsáideoirí, agus ní hamháin le tonnadóirí, mar atá in Google Analytics, áit a laghdaítear an leibhéal sonraí go tonnadóir go minic, cé go dtógtar é do mhír áirithe.

Coinneáil agus cásanna

Mar shampla den uirlis fhorbartha a úsáid, is féidir linn cás seirbhíse nideoige mór sa Rúis a lua. Tá feidhmchlár soghluaiste Android ag an gcuideachta seo a bhfuil tóir air i measc custaiméirí. Bhí an láimhdeachas bliantúil ón bhfeidhmchlár soghluaiste thart ar 7 milliún rúbal, bhí luaineachtaí séasúracha idir 60-130. Tá iarratas ag an gcuideachta chéanna freisin ar iOS, agus bhí meánbhille úsáideora feidhmchlár Apple níos airde ná an meánbhille de cliant ag baint úsáide as an iarratas Android - 1080 rúbal. i gcoinne 1300 rúbal.

Chinn an chuideachta éifeachtúlacht an fheidhmchláir Android a mhéadú, agus rinne sé anailís chríochnúil ina leith. Gineadh roinnt dosaen hipitéisí faoi éifeachtacht an fheidhmchláir a mhéadú. Tar éis Coinneáil a úsáid, d'éirigh sé amach go raibh an fhadhb sna teachtaireachtaí a taispeánadh d'úsáideoirí nua. Fuair ​​​​siad faisnéis faoin mbranda, buntáistí na cuideachta agus praghsanna. Ach, mar a d'éirigh sé amach, bhí na teachtaireachtaí ceaptha chun cabhrú leis an úsáideoir foghlaim conas a bheith ag obair san fheidhmchlár.

Coinneáil: conas a scríobhamar uirlisí foinse oscailte le haghaidh anailíse táirgí i Python agus Pandas

Rinneadh é seo, agus mar thoradh air sin tháinig an t-iarratas níos lú neamhshuiteáilte, agus b'ionann an méadú ar chomhshó go hordú 23%. Ar dtús, tugadh 20 faoin gcéad den trácht ag teacht isteach don tástáil, ach tar éis cúpla lá, tar éis anailís a dhéanamh ar na chéad torthaí agus measúnú a dhéanamh ar an treocht, d'aisiompaigh siad na comhréireanna agus, ar a mhalairt, d'fhág siad 20 faoin gcéad don ghrúpa rialaithe, agus cuireadh ochtó faoin gcéad sa tástáil. Seachtain ina dhiaidh sin, socraíodh dhá hipitéis eile a thástáil go seicheamhach. I díreach seacht seachtaine, mhéadaigh an láimhdeachas ón bhfeidhmchlár Android uair go leith i gcomparáid leis an leibhéal roimhe sin.

Conas a bheith ag obair le Coinneáil?

Tá na chéad chéimeanna simplí go leor - íoslódáil an leabharlann leis an ordú coinneála suiteála pip. Tá samplaí réamhdhéanta agus cásanna próiseála sonraí le haghaidh roinnt tascanna anailísíochta táirgí sa stór féin. Déantar an tacar a nuashonrú i gcónaí go dtí go bhfuil sé go leor don chéad aithne. Is féidir le duine ar bith modúil réamhdhéanta a ghlacadh agus iad a chur i bhfeidhm láithreach ar a gcuid tascanna - ligeann sé seo dóibh an próiseas anailíse níos mionsonraithe agus leas iomlán a bhaint as conairí úsáideoirí a chur ar bun láithreach chomh tapa agus chomh héifeachtach agus is féidir. Fágann sé seo go léir gur féidir patrúin úsáide feidhmchlár a aimsiú trí chód soiléir agus an taithí seo a roinnt le comhghleacaithe.

Is uirlis é coinneáil ar fiú í a úsáid ar feadh shaolré d’fheidhmchláir, agus seo an fáth:

  • Tá coinneáil éifeachtach chun conairí úsáideoirí a rianú agus a bharrfheabhsú go leanúnach agus chun feidhmíocht ghnó a fheabhsú. Mar sin, is minic a chuirtear gnéithe nua le feidhmchláir ríomhthráchtála, agus ní féidir a thionchar ar an táirge a thuar i gceart i gcónaí. I gcásanna áirithe, tagann fadhbanna comhoiriúnachta chun cinn idir feidhmeanna nua agus sean - mar shampla, déanann feidhmeanna nua “canibalú” ar na cinn atá ann cheana féin. Agus sa chás seo, tá anailís leanúnach ar ruthag go beacht cad is gá.
  • Tá an cás cosúil le linn oibriú le bealaí fógraíochta: tá foinsí tráchta nua agus cruthaitheacha fógraíochta á thástáil i gcónaí, is gá monatóireacht a dhéanamh ar shéasúracht, ar threochtaí agus ar thionchar imeachtaí eile, rud a fhágann go dtiocfaidh cineálacha fadhbanna níos mó agus níos mó chun cinn. Éilíonn sé seo freisin monatóireacht agus léirmhíniú leanúnach ar mheicnic úsáideoirí.
  • Tá roinnt fachtóirí ann a théann i bhfeidhm i gcónaí ar fheidhmíocht iarratais. Mar shampla, eisiúintí nua ó fhorbróirí: dúnadh fadhb reatha, cuireann siad an seancheann ar ais i ngan fhios dóibh nó cruthaíonn siad ceann nua go hiomlán. Le himeacht ama, fásann líon na n-eisiúintí nua, agus ní mór an próiseas chun earráidí a rianú a uathoibriú, lena n-áirítear trí anailís a dhéanamh ar chonairí úsáideoirí.

Tríd is tríd, is uirlis éifeachtach é Coinneáil. Ach níl aon teorainn le foirfeacht - is féidir agus ba chóir é a fheabhsú, a fhorbairt, agus táirgí nua fionnuar a thógáil ar a mbonn. Dá gníomhaí atá pobal an tionscadail, is amhlaidh is mó forcanna a bheidh ann, agus beidh roghanna suimiúla nua le feiceáil chun é a úsáid.

Tuilleadh eolais faoi uirlisí coinneála:

Foinse: will.com

Add a comment