Retentioneering: nola idatzi genituen kode irekiko produktuen analisirako tresnak Python eta Pandas-en

Kaixo Habr. Artikulu hau aplikazio batean edo webgune batean erabiltzaileen mugimenduaren ibilbideak prozesatzeko metodo eta tresna multzo baten lau urteko garapenaren emaitzei eskainia dago. Garapenaren egilea - Maxim Godzi, produktu sortzaileen taldeko buruan dagoena, artikuluaren egilea ere bada. Produktua bera Retentioneering deitzen zen, orain kode irekiko liburutegi batean bihurtu da eta Github-en ostatatuta, edonork erabil dezan. Hori guztia interesgarria izan daiteke produktuaren eta marketinaren azterketan, produktuen sustapenean eta garapenean dihardutenentzat. Bide batez, HabrΓ©-n artikulu bat argitaratu da dagoeneko Retentioneering-ekin lan egiteko kasuetako bati buruz. Material berriak produktua zertarako gai den eta nola erabil daitekeen azaltzen du.

Artikulua irakurri ondoren, zure Retentioneering idatzi ahal izango duzu, aplikazioan eta haratago erabiltzaileen ibilbideak prozesatzeko edozein metodo estandarizatua izan daiteke, jokabidearen ezaugarriak zehatz-mehatz ikusteko eta honetatik ikuspegiak ateratzeko aukera emanez. negozio-neurriak.

Zer da Retentioneering eta zergatik behar da?

Hasieran, gure helburua Growth Hacking-a "sorginkeria digitalaren" mundutik zenbakien, analisiaren eta aurreikuspenen mundura eramatea zen. Ondorioz, produktuen analisia matematika eta programazio hutsera murrizten da istorio fantastikoen ordez zenbakiak nahiago dituztenentzat, eta formulak "rebranding", "repositioning", etab. bezalako hitz adimendunetara, itxura ederra dutenak, baina ez dute asko laguntzen. praktikatu.

Arazo hauek konpontzeko, grafikoen eta ibilbideen bidezko analitikaren esparru bat behar genuen, eta, aldi berean, analisten errutina tipikoak sinplifikatzen dituen liburutegi bat, gizakientzat zein robotentzat ulergarri izango ziren produktuen analisiko zeregin arruntak deskribatzeko modu gisa. Liburutegiak erabiltzailearen portaera deskribatzeko eta produktuen negozio-neurriekin lotzeko gaitasuna eskaintzen du, hain lengoaia formal eta argi batean, garatzaileen eta analistaren ohiko zereginak sinplifikatzeko eta automatizatzeko, eta negozioarekin komunikazioa errazteko.

Retentioneering metodo eta software analitikoko tresna bat da, edozein produktu digital (eta ez bakarrik) egokitu eta integra daitekeena.

2015ean hasi ginen produktua lantzen. Orain prest egindako tresna-multzo bat da, nahiz eta oraindik ez den aproposa datuak Python eta Pandas-en lan egiteko, sklearn-en antzeko api-a duten ikaskuntza automatikoko ereduak, eli5-en emaitzak interpretatzeko tresnak eta shap ikasketa automatikoko ereduak.

Dena bilduta dago Github biltegi irekiko kode irekiko liburutegi eroso batean - retentioneering-tools. Liburutegia erabiltzea ez da zaila, produktuen analisia maite duen ia edonork, baina aurretik koderik idatzi ez duenak, gure analisi-metodoak bere datuetan aplika ditzake bere kabuz eta denbora asko eman gabe.

Bada, programatzaile batek, aplikazio-sortzaileak edo garapen- edo proba-talde bateko kide batek analisirik inoiz egin ez duen kode honekin jolasten has daiteke eta bere aplikazioa erabiltzeko ereduak ikus ditzake kanpoko laguntzarik gabe.

Erabiltzailearen ibilbidea analisiaren oinarrizko elementu gisa eta prozesatzeko metodoak

Erabiltzailearen ibilbidea denbora-puntu jakin batzuetan erabiltzailearen egoeren sekuentzia bat da. Gainera, gertaerak hainbat datu-iturritakoak izan daitezke, linean zein lineaz kanpo. Erabiltzaileari gertatutako gertaerak bere ibilbidearen parte dira. Adibideak:
β€’ botoia sakatu du
β€’ irudi bat ikusi du
β€’ sakatu pantaila
β€’ mezu elektroniko bat jaso du
β€’ lagun bati produktua gomendatu
β€’ formularioa bete
β€’ pantaila sakatu zuen
β€’ korritu
β€’ kutxara hurbildu zen
β€’ burrito bat agindu zuen
β€’ burrito bat jan
β€’ jan zuen burritoak pozoindua
β€’ kafetegira sartu zen atzeko sarreratik
β€’ sarrera nagusitik sartu
β€’ aplikazioa gutxitu
β€’ push jakinarazpena jaso du
β€’ ergelak pantailan denbora luzeagoan Π₯
β€’ eskaera ordaindu
β€’ agindua trukatu du
β€’ mailegu bat ukatu zitzaion

Erabiltzaile talde baten ibilbidearen datuak hartzen badituzu eta trantsizioek nola funtzionatzen duten aztertzen baduzu, aplikazioan duten portaera nola eraikitzen den ikus dezakezu. Komenigarria da egoerak nodoak diren eta egoeren arteko trantsizioak ertzak diren grafiko baten bidez egitea:

Retentioneering: nola idatzi genituen kode irekiko produktuen analisirako tresnak Python eta Pandas-en

"Ibilbidea" oso kontzeptu erosoa da - erabiltzaileen ekintza guztiei buruzko informazio zehatza dauka, ekintza horien deskribapenari datu gehigarriak gehitzeko aukerarekin. Horrek objektu generiko bihurtzen du. Ibilbideekin lan egiteko aukera ematen duten tresna eder eta erosoak badituzu, orduan antzekotasunak aurkitu eta segmentatu ditzakezu.

Ibilbidearen segmentazioa oso konplikatua dirudi hasieran. Egoera normal batean, hori egia da: konektibitate-matrizeen konparaketa edo sekuentzien lerrokadura erabili behar duzu. Modu errazagoa aurkitzea lortu genuen: ibilbide ugari aztertzea eta clustering bidez segmentatzea.

Ikusten denez, posible da ibilbide bat puntu bihurtzea etengabeko irudikapenak erabiliz, adibidez, TF-IDF. Eraldaketaren ondoren, ibilbidea espazioko puntu bat bihurtzen da, non ardatzetan zehar hainbat gertakariren ibilbidean eta haien arteko trantsizioen agerraldi normalizatua irudikatzen den. Mila eta gehiago dimentsioko espazio handi bateko gauza hau (dimS=sum(gertaera motak)+sum(ngrams_2 motak)), plano batean proiekta daiteke. TSNE. TSNE - eraldaketa, espazioaren dimentsioa 2 ardatzetara murrizten du eta, ahal bada, puntuen arteko distantzia erlatiboak gordetzen ditu. Horren arabera, posible egiten da mapa lau batean, ibilbideen proiekzio-mapa figuratiboan, ibilbide ezberdinetako puntuak euren artean nola kokatzen ziren aztertzea. Elkarrengandik zenbat hurbil edo desberdinak ziren aztertzen da, multzoak osatzen zituzten edo mapan barreiatuta, etab.:

Retentioneering: nola idatzi genituen kode irekiko produktuen analisirako tresnak Python eta Pandas-en

Retentioneering analisi-tresnek datu eta ibilbide konplexuak elkarren artean alderatu daitekeen irudikapen bihurtzeko gaitasuna ematen dute, eta gero eraldaketaren emaitza esploratu eta interpretatzeko.

Ibilbide estandarrak prozesatzeko metodoez hitz egitean, Retentioneering-en ezarri ditugun hiru tresna nagusi esan nahi ditugu: grafikoak, urrats-matrizeak eta ibilbidearen proiekzio-mapak.

Google Analytics, Firebase eta antzeko analisi-sistemekin lan egitea nahiko zaila da eta ez da %100 eraginkorra. Arazoa erabiltzailearentzako hainbat muga da, eta, ondorioz, analistak halako sistemetan egiten duen lana saguaren kliketan eta xerrak hautatzean oinarritzen da. Retentioneering-ek erabiltzaileen ibilbideekin lan egitea ahalbidetzen du, eta ez inbutuekin soilik, Google Analytics-en bezala, non xehetasun-maila maiz inbutu batera murrizten den, nahiz eta segmentu jakin baterako eraikia izan.

Atxikitzea eta kasu praktikoak

Garatutako tresna erabiltzearen adibide gisa, Errusiako nitxo zerbitzu handi baten kasua aipa dezakegu. Enpresa honek bezeroen artean ezaguna den Android aplikazio mugikor bat du. Mugikorretarako aplikazioaren urteko fakturazioa 7 milioi errublo ingurukoa zen, sasoiko gorabeherak 60-130 mila bitartekoak izan ziren. Enpresa berak iOS aplikazio bat ere badu, eta "sagar" aplikazioaren erabiltzailearen batez besteko egiaztapena batez bestekoa baino handiagoa izan zen. Bezeroa Android aplikazioa erabiliz egiaztatu - 1080 igurtzi. 1300 errubloren aurka.

Konpainiak Android aplikazioaren eraginkortasuna areagotzea erabaki zuen, eta horretarako azterketa sakon bat egin zuen. Dozena bat hipotesi sortu ziren aplikazioaren eraginkortasuna areagotzeko. Retentionneering erabili ondoren, arazoa erabiltzaile berriei erakutsitako mezuetan zegoela ikusi zen. Markaren, enpresaren abantailak eta prezioei buruzko informazioa jaso zuten. Baina, ondorioztatu zenez, mezuek erabiltzaileari aplikazioan lan egiten ikasten lagundu behar zioten.

Retentioneering: nola idatzi genituen kode irekiko produktuen analisirako tresnak Python eta Pandas-en

Hori egin zen, ondorioz aplikazioa gutxiago ezabatzen hasi zen, eta eskaera bihurtzearen igoera %23koa izan zen. Hasieran, sarrerako trafikoaren ehuneko 20 eman zioten probari, baina egun batzuk geroago, lehen emaitzak aztertu eta joera ebaluatu ondoren, proportzioak irauli eta, aitzitik, ehuneko 20 utzi zuten kontrol-taldearentzat, eta jarri zuten. ehuneko laurogei proban. Astebete geroago, beste bi hipotesiren probak sekuentzialki gehitzea erabaki zen. Zazpi astetan, Android aplikazioaren fakturazioa bider eta erdi hazi zen aurreko mailarekin alderatuta.

Nola lan egin Retentioneering-ekin?

Lehen urratsak nahiko sinpleak dira: liburutegia pip install retentioneering komandoarekin kargatzen dugu. Biltegiak berak prestatutako adibideak eta datuak prozesatzeko kasuak ditu produktuaren analisi-zeregin batzuetarako. Multzoa etengabe eguneratzen da lehen ezagunarentzat nahikoa izan arte. Guztiek prest egindako moduluak har ditzakete eta berehala aplika ditzakete bere zereginetara - horri esker, berehala konfigura dezakezu erabiltzailearen ibilbideen analisi zehatzagoa eta optimizazio prozesua ahalik eta azkarren eta eraginkorrenean. Horrek guztiak ahalbidetzen du aplikazioen erabilera-ereduak aurkitzea kode ulergarriaren bidez eta esperientzia hau lankideekin partekatzea.

Retentioneering aplikazio baten bizitzan zehar erabiltzea merezi duen tresna da, eta hona hemen zergatik:

  • Retentioneering eraginkorra da erabiltzaileen ibilbideak jarraitzeko eta etengabe optimizatzeko eta negozioaren errendimendua hobetzeko. Beraz, merkataritza elektronikoko aplikazioei eginbide berriak gehitzen zaizkie sarri, eta produktuan duten eragina ezin da beti behar bezala aurreikusi. Zenbait kasutan, ezaugarri berrien eta zaharren arteko bateragarritasun arazoak daude; adibidez, berriek lehendik daudenak "kanibalizatu" egiten dituzte. Eta egoera honetan, ibilbideen etengabeko azterketa egin behar da.
  • Egoera antzekoa da publizitate-kanalekin lan egitean: trafiko iturri berriak eta publizitate-sorkuntzak etengabe probatzen ari dira, beharrezkoa da urtarokotasuna, joerak eta beste gertaeren eragina kontrolatzea, eta horrek arazo-klase berriak agertzea dakar. Erabiltzaileen mekanikaren etengabeko jarraipena eta interpretazioa ere eskatzen du.
  • Aplikazioaren funtzionamenduan etengabe eragiten duten hainbat faktore daude. Adibidez, garatzaileen bertsio berriak: benetako arazo bat itxiz, nahi gabe zaharra itzultzen dute edo guztiz berria sortzen dute. Denborarekin, bertsio berrien kopurua hazten da, eta akatsen jarraipena automatizatu behar da, baita erabiltzaileen ibilbideak aztertuz ere.

Orokorrean, atxikipena tresna eraginkorra da. Baina ez dago perfekzioaren mugarik - hobetu, garatu eta produktu fresko berriak bere oinarrian eraiki daitezke eta egin behar dira. Proiektu-komunitatea zenbat eta aktiboagoa izan, orduan eta bidegurutze gehiago egongo dira, bere erabilerarako aukera interesgarri berriak agertuko dira.

Retentioneering tresnei buruzko informazio gehiago:

Iturria: www.habr.com

Gehitu iruzkin berria