Хадгалах: бид Python болон Pandas дээр бүтээгдэхүүний аналитикийн нээлттэй эхийн хэрэгслийг хэрхэн бичсэн

Сайн уу, Хабр. Энэхүү нийтлэлийг програм эсвэл вэбсайт дахь хэрэглэгчийн хөдөлгөөний траекторийг боловсруулах олон арга, хэрэгслийг боловсруулсан дөрвөн жилийн үр дүнд зориулагдсан болно. Хөгжлийн зохиогч - Максим Годзи, бүтээгдэхүүн бүтээгчдийн багийг тэргүүлдэг бөгөөд мөн нийтлэлийн зохиогч юм. Бүтээгдэхүүнийг өөрөө Retentioneering гэж нэрлэдэг байсан бөгөөд одоо үүнийг нээлттэй эхийн номын сан болгон хувиргаж, Github дээр байрлуулсан бөгөөд ингэснээр хэн ч үүнийг ашиглах боломжтой болсон. Энэ бүхэн нь бүтээгдэхүүн, маркетингийн шинжилгээ, сурталчилгаа, бүтээгдэхүүн боловсруулахад оролцдог хүмүүст сонирхолтой байж магадгүй юм. Дашрамд хэлэхэд, Хабре дээр Retentioneering-тэй хамтран ажиллаж байсан тохиолдлын нэг талаар нийтлэл аль хэдийн нийтлэгдсэн байна. Шинэ материал нь тухайн бүтээгдэхүүн юу хийж чадах, хэрхэн ашиглах талаар тайлбарласан.

Өгүүллийг уншсаны дараа та өөрөө Retentioneering-ээ бичих боломжтой бөгөөд энэ нь хэрэглэгчийн үйл ажиллагааны чиглэлийг програм болон түүнээс цааш боловсруулах стандартчилсан арга байж болох бөгөөд ингэснээр зан төлөвийн шинж чанарыг нарийвчлан харж, өсөлтийн талаархи ойлголтыг авах боломжтой болно. бизнесийн хэмжүүрүүд.

Retentioneering гэж юу вэ, яагаад хэрэгтэй вэ?

Бидний анхны зорилго бол Growth Hacking-ийг "дижитал илбэ" ертөнцөөс тоо, аналитик, таамаглалын ертөнцөд шилжүүлэх явдал байв. Үүний үр дүнд бүтээгдэхүүний аналитик нь гайхалтай түүхийн оронд тоог илүүд үздэг хүмүүст зориулсан цэвэр математик, програмчлал болон хувирч, томъёолол нь "rebranding", "replacement" гэх мэт сайхан сонсогддог боловч практик дээр бага зэрэг ашиг тустай байдаг.

Эдгээр асуудлыг шийдвэрлэхийн тулд бидэнд график болон замналаар аналитик хийх хүрээ хэрэгтэй байсан ба үүний зэрэгцээ хүмүүс болон роботуудад ойлгомжтой байхуйц бүтээгдэхүүний аналитикийн байнгын даалгавруудыг тайлбарлах арга болгон аналитикийн ердийн дэг журмыг хялбаршуулдаг номын сан хэрэгтэй байсан. Номын сан нь хэрэглэгчийн зан төлөвийг дүрслэх, бүтээгдэхүүний бизнесийн хэмжигдэхүүнтэй холбох чадварыг албан ёсны бөгөөд ойлгомжтой хэлээр хангадаг бөгөөд энэ нь хөгжүүлэгчид болон шинжээчдийн ердийн ажлуудыг хялбарчилж, автоматжуулж, бизнестэй харилцах харилцааг хөнгөвчлөх боломжийг олгодог.

Хадгалах нь аливаа дижитал (зөвхөн биш) бүтээгдэхүүнд тохируулж, нэгтгэх боломжтой арга, аналитик програм хангамжийн хэрэгсэл юм.

Бид 2015 оноос уг бүтээгдэхүүн дээр ажиллаж эхэлсэн. Одоо энэ нь Python болон Pandas дээрх өгөгдөлтэй ажиллахад зориулагдсан бэлэн, гэхдээ хараахан тохирохгүй байгаа хэрэгслүүд, sklearn шиг api бүхий машин сургалтын загварууд, eli5 болон shap машин сургалтын загваруудын үр дүнг тайлбарлах хэрэгслүүд юм.

Бүгдийг боосон нээлттэй Github репозитор дахь тохиромжтой нээлттэй эхийн номын сан руу - retentioneering-tools. Номын санг ашиглах нь тийм ч хэцүү биш бөгөөд бүтээгдэхүүний аналитикт дуртай, гэхдээ өмнө нь код бичээгүй бараг бүх хүн манай аналитик аргуудыг өөрийн өгөгдөлд бие даан, их хэмжээний хөрөнгө оруулалтгүйгээр ашиглах боломжтой.

Программист, програм бүтээгч, эсвэл урьд өмнө хэзээ ч аналитик хийж байгаагүй хөгжүүлэлтийн эсвэл туршилтын багийн гишүүн энэ кодоор тоглож эхлэх бөгөөд гаднаас тусламж авалгүйгээр програмынхаа хэрэглээний загварыг харах боломжтой.

Хэрэглэгчийн замнал нь шинжилгээний үндсэн элемент бөгөөд түүнийг боловсруулах арга

Хэрэглэгчийн замнал нь тодорхой цаг хугацааны хэрэглэгчийн төлөвийн дараалал юм. Түүнчлэн, үйл явдлууд нь онлайн болон офлайн байдлаар өөр өөр мэдээллийн эх сурвалжаас ирж болно. Хэрэглэгчид тохиолдох үйл явдлууд нь түүний замналын нэг хэсэг юм. Жишээ нь:
• товчийг дарсан
• зургийг харсан
• дэлгэц дээр дарах
• имэйл хүлээн авсан
• бүтээгдэхүүнийг найздаа санал болгосон
• маягтыг бөглөсөн
• дэлгэц дээр товшсон
• гүйлгэсэн
• кассын машин руу явсан
• буррито захиалсан
• буррито идсэн
• буррито идэж хордсон
• арын хаалганаас кафе руу оров
• урд талын хаалганаас орсон
• програмыг багасгасан
• түлхэх мэдэгдэл хүлээн авсан
• дэлгэцэн дээр X-ээс удаан гацсан
• захиалгын төлбөрийг төлсөн
• захиалга худалдаж авсан
• зээл авахаас татгалзсан

Хэрэв та хэсэг хэрэглэгчдийн траекторийн өгөгдлийг авч, шилжилтүүд хэрхэн бүтэцлэгдсэнийг судалбал програм дахь тэдний зан төлөвийг яг таг ажиглаж болно. Үүнийг төлөвүүд нь зангилаа, төлөв хоорондын шилжилт нь ирмэг байх графикаар дамжуулан хийхэд тохиромжтой.

Хадгалах: бид Python болон Pandas дээр бүтээгдэхүүний аналитикийн нээлттэй эхийн хэрэгслийг хэрхэн бичсэн

"Траектор" нь маш тохиромжтой ойлголт бөгөөд энэ нь хэрэглэгчийн бүх үйлдлийн талаархи дэлгэрэнгүй мэдээллийг агуулсан бөгөөд эдгээр үйлдлийн тайлбарт нэмэлт мэдээлэл оруулах боломжтой. Энэ нь түүнийг бүх нийтийн объект болгодог. Хэрэв танд замналтай ажиллах боломжийг олгодог үзэсгэлэнтэй, тохиромжтой хэрэгсэл байгаа бол та ижил төстэй байдлыг олж, тэдгээрийг сегментчилж болно.

Замын сегментчилэл нь эхлээд маш төвөгтэй мэт санагдаж магадгүй юм. Ердийн нөхцөлд ийм тохиолдол байдаг - та холболтын матрицын харьцуулалт эсвэл дарааллын тохируулгыг ашиглах хэрэгтэй. Бид илүү энгийн арга замыг олж чадсан - олон тооны траекторийг судалж, тэдгээрийг кластер хийх замаар сегментчилэх.

Тасралтгүй дүрслэлийг ашиглан траекторийг цэг болгон хувиргах боломжтой болсон, жишээлбэл, TF-IDF. Өөрчлөлтийн дараа траектори нь тэнхлэгийн дагуу янз бүрийн үйл явдал, тэдгээрийн хоорондох шилжилтийн хэвийн үзэгдэлийг харуулсан орон зайд цэг болдог. Асар том мянга буюу түүнээс дээш хэмжээст орон зайнаас (dimS=sum(үйл явдлын төрлүүд)+нийлбэр(gramms_2 төрөл)) энэ зүйлийг ашиглан хавтгайд төлөвлөх боломжтой. TSNE. TSNE нь орон зайн хэмжээсийг 2 тэнхлэг болгон багасгаж, боломжтой бол цэгүүдийн хоорондох харьцангуй зайг хадгалах өөрчлөлт юм. Үүний дагуу янз бүрийн траекторын цэгүүд хоорондоо хэрхэн байрлаж байсныг судлах боломжтой хавтгай газрын зураг, траекторийн дүрслэлийн төсөөллийн зураг дээр. Энэ нь тэдгээр нь хоорондоо хэр ойрхон эсвэл өөр байсан, кластер үүсгэсэн эсвэл газрын зураг дээр тархсан эсэх гэх мэтийг шинжилдэг.

Хадгалах: бид Python болон Pandas дээр бүтээгдэхүүний аналитикийн нээлттэй эхийн хэрэгслийг хэрхэн бичсэн

Хадгалах аналитик хэрэгслүүд нь нарийн төвөгтэй өгөгдөл, траекторийг бие биетэйгээ харьцуулж болохуйц харагдац болгон хувиргах, улмаар өөрчлөлтийн үр дүнг шалгаж, тайлбарлах боломжийг олгодог.

График, алхамын матриц, траекторийн проекцын зураг гэсэн гурван үндсэн хэрэгслийг хадгалахад хэрэгжүүлсэн траекторийг боловсруулах стандарт аргын тухай ярих юм.

Google Analytics, Firebase болон ижил төстэй аналитик системүүдтэй ажиллах нь нэлээд төвөгтэй бөгөөд 100% үр дүнтэй биш юм. Асуудал нь хэрэглэгчдэд зориулсан хэд хэдэн хязгаарлалт бөгөөд үүний үр дүнд шинжээчийн ийм систем дэх ажил нь хулганы товшилт, зүсмэлүүдийг сонгох зэргээс хамаардаг. Хадгалах нь Google Analytics-д байдаг шиг зөвхөн юүлүүрээр бус хэрэглэгчийн зам мөртэй ажиллах боломжтой болгодог бөгөөд энэ нь тодорхой сегментэд зориулагдсан ч нарийвчилсан түвшнийг ихэвчлэн юүлүүр болгон бууруулдаг.

Хадгалах ба хэргүүд

Боловсруулсан хэрэгслийг ашиглах жишээ болгон бид Орос дахь томоохон үйлчилгээний жишээг дурдаж болно. Энэ компани нь хэрэглэгчдийн дунд түгээмэл хэрэглэгддэг Android гар утасны програмтай. Мобайл програмын жилийн эргэлт нь ойролцоогоор 7 сая рубль, улирлын хэлбэлзэл нь 60-130 мянган рубль байв.Ижил компанид iOS үйлдлийн системд зориулсан програм байдаг бөгөөд Apple програмын хэрэглэгчийн дундаж төлбөр нь 1080 оны дундаж төлбөрөөс өндөр байв. Android програмыг ашигладаг үйлчлүүлэгч - 1300 рубль. XNUMX рубльтэй харьцуулахад.

Тус компани Android програмын үр ашгийг нэмэгдүүлэхээр шийдсэн бөгөөд үүнд зориулж нарийвчилсан дүн шинжилгээ хийсэн. Хэрэглээний үр нөлөөг нэмэгдүүлэх талаар хэдэн арван таамаглал дэвшүүлсэн. Retentionneering-ийг ашигласны дараа асуудал нь шинэ хэрэглэгчдэд үзүүлсэн мессежүүдэд байсан нь тогтоогдсон. Тэд брэнд, компанийн ашиг тус, үнийн талаар мэдээлэл авсан. Гэсэн хэдий ч мессежүүд нь хэрэглэгчдэд програм дээр хэрхэн ажиллах талаар сурахад туслах ёстой байсан нь тодорхой болсон.

Хадгалах: бид Python болон Pandas дээр бүтээгдэхүүний аналитикийн нээлттэй эхийн хэрэгслийг хэрхэн бичсэн

Үүнийг хийсэн бөгөөд үүний үр дүнд програмыг устгах нь багасч, захиалга руу хөрвүүлэх өсөлт 23% байна. Эхлээд орж ирж буй урсгалын 20 хувийг туршилтад өгдөг байсан бол хэдхэн хоногийн дараа эхний үр дүнд дүн шинжилгээ хийж, чиг хандлагыг үнэлсний дараа тэд пропорцийг эргүүлж, эсрэгээр нь хяналтын бүлэгт 20 хувийг үлдээж, мөн ная хувь нь шалгалтад хамрагдсан. Долоо хоногийн дараа дахин хоёр таамаглалын тестийг дараалан нэмэхээр шийдэв. Долоон долоо хоногийн дотор Андройд програмын эргэлт өмнөх түвшинтэй харьцуулахад нэг хагас дахин өссөн байна.

Retentioneering-тэй хэрхэн ажиллах вэ?

Эхний алхамууд нь маш энгийн - pip install retentioneering командын тусламжтайгаар номын санг татаж аваарай. Репозитор нь өөрөө зарим бүтээгдэхүүний аналитик даалгаврын хувьд өгөгдөл боловсруулах бэлэн жишээ, тохиолдлуудыг агуулдаг. Анхны танил болоход хангалттай болтол багц нь байнга шинэчлэгддэг. Хэн ч бэлэн модулиудыг авч, тэдгээрийг ажилдаа нэн даруй ашиглах боломжтой - энэ нь тэдэнд илүү нарийвчилсан дүн шинжилгээ хийх, хэрэглэгчийн чиглэлийг оновчтой болгох үйл явцыг аль болох хурдан, үр дүнтэй болгох боломжийг олгодог. Энэ бүхэн нь тодорхой кодоор дамжуулан програмын ашиглалтын хэв маягийг олж, энэ туршлагаа хамтран ажиллагсадтайгаа хуваалцах боломжийг олгодог.

Хадгалах нь таны хэрэглээний туршид ашиглахад тохиромжтой хэрэгсэл бөгөөд яагаад гэвэл:

  • Хадгалах нь хэрэглэгчийн замыг хянах, тасралтгүй оновчтой болгох, бизнесийн гүйцэтгэлийг сайжруулахад үр дүнтэй байдаг. Тиймээс цахим худалдааны програмуудад шинэ боломжуудыг нэмж оруулдаг бөгөөд бүтээгдэхүүнд үзүүлэх нөлөөллийг үргэлж зөв таамаглах боломжгүй байдаг. Зарим тохиолдолд шинэ болон хуучин функцүүдийн хооронд нийцтэй байдлын асуудал үүсдэг - жишээлбэл, шинэ функцууд нь одоо байгаа функцүүдийг "каннибалж" байдаг. Ийм нөхцөлд траекторийн байнгын дүн шинжилгээ нь яг хэрэгтэй зүйл юм.
  • Зар сурталчилгааны сувгуудтай ажиллахад нөхцөл байдал ижил төстэй байна: замын хөдөлгөөний шинэ эх үүсвэрүүд, зар сурталчилгааны бүтээлүүд байнга туршиж байдаг тул улирлын шинж чанар, чиг хандлага, бусад үйл явдлын нөлөөг хянах шаардлагатай байдаг бөгөөд энэ нь улам олон шинэ ангиллын асуудал үүсэхэд хүргэдэг. Энэ нь мөн хэрэглэгчийн механикийн байнгын хяналт, тайлбарыг шаарддаг.
  • Хэрэглээний гүйцэтгэлд байнга нөлөөлдөг хэд хэдэн хүчин зүйл байдаг. Жишээлбэл, хөгжүүлэгчдийн шинэ хувилбарууд: одоогийн асуудлыг хааж, тэд санамсаргүйгээр хуучин хувилбараа буцааж эсвэл цоо шинэ хувилбарыг бий болгодог. Цаг хугацаа өнгөрөх тусам шинэ хувилбаруудын тоо нэмэгдэж, алдааг хянах үйл явцыг автоматжуулах шаардлагатай бөгөөд үүнд хэрэглэгчийн замнал руу дүн шинжилгээ хийх хэрэгтэй.

Ерөнхийдөө Retentioneering бол үр дүнтэй хэрэгсэл юм. Гэхдээ төгс төгөлдөрт хязгаар байхгүй - үүнийг сайжруулж, хөгжүүлж, түүн дээр үндэслэн шинэ гайхалтай бүтээгдэхүүнийг бий болгож чадна. Төслийн нийгэмлэг хэдий чинээ идэвхтэй байна төдий чинээ олон салаа байх бөгөөд үүнийг ашиглах сонирхолтой шинэ сонголтууд гарч ирнэ.

Хадгалах хэрэгслийн талаарх дэлгэрэнгүй мэдээлэл:

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх