Retentioneering: Python жана Pandas тилдеринде продукт аналитикасы үчүн ачык булактуу куралдарды кантип жаздык

Салам, Хабр. Бул макала тиркемеде же веб-сайтта колдонуучунун кыймылынын траекториясын иштетүү үчүн ыкмалардын жана инструменттердин комплексин иштеп чыгуунун төрт жылдык жыйынтыгына арналган. Иштеп чыгуунун автору - Максим Годзи, продукцняны тузуучулердун командасын жетектеген жана макаланын автору да. Продукттун өзү Retentioneering деп аталды; ал азыр ачык булактуу китепканага айландырылып, аны каалагандар колдоно алышы үчүн Githubга жайгаштырылды. Мунун баары продукт жана маркетинг талдоо, жылдыруу жана өнүмдү иштеп чыгуу менен алектенген адамдар үчүн кызыктуу болушу мүмкүн. Баса, Хабреде Retentioneering менен иштөө учурларынын бири жөнүндө макала буга чейин жарыяланган. Жаңы материал продукт эмне кыла аларын жана аны кантип колдонсо болорун түшүндүрөт.

Макаланы окуп чыккандан кийин, сиз өзүңүздүн Retentioneering жаза аласыз; бул колдонуучу траекториясын колдонуунун жана андан тышкары иштетүүнүн стандартташтырылган ыкмасы болушу мүмкүн, бул жүрүм-турумдун өзгөчөлүктөрүн деталдуу түрдө көрүүгө жана андан өсүү үчүн түшүнүктөрдү алууга мүмкүндүк берет. бизнес көрсөткүчтөр.

Retentioneering деген эмне жана ал эмне үчүн керек?

Биздин баштапкы максатыбыз Growth Hackingди "санариптик сыйкырчылык" дүйнөсүнөн сандар, аналитика жана божомолдор дүйнөсүнө көчүрүү болчу. Натыйжада, өнүм аналитикасы фантастикалык окуялардын ордуна сандарды артык көргөндөр үчүн таза математикага жана программалоого, ал эми формулалардан "ребрендинг", "кайра жайгаштыруу" ж.

Бул көйгөйлөрдү чечүү үчүн бизге графиктер жана траекториялар аркылуу аналитиканын негизи жана ошол эле учурда адамдар үчүн да, роботтор үчүн да түшүнүктүү болгон продукт аналитикасынын үзгүлтүксүз тапшырмаларын сүрөттөө ыкмасы катары типтүү аналитиктин иш тартибин жөнөкөйлөтүүчү китепкана керек болду. Китепкана колдонуучунун жүрүм-турумун сүрөттөп, аны формалдуу жана түшүнүктүү тилде продукт бизнесинин метрикасына байланыштыруу мүмкүнчүлүгүн берет, ал иштеп чыгуучулардын жана аналитиктердин күнүмдүк тапшырмаларын жөнөкөйлөтүп, автоматташтырат жана алардын бизнес менен байланышын жеңилдетет.

Retentioneering - бул кандайдыр бир санариптик (жана гана эмес) продуктуга ыңгайлаштырылган жана интеграцияланган метод жана аналитикалык программалык каражаттар.

Биз 2015-жылы буюмдун үстүндө иштей баштадык. Эми бул дайын, бирок идеалдуу болбосо да, маалыматтар менен иштөө үчүн Python жана Pandas куралдар топтому, sklearn сыяктуу api менен машина үйрөнүү моделдери, eli5 жана shap машина үйрөнүү моделдеринин натыйжаларын чечмелөө куралдары.

Мунун баары бүттү ачык Github репозиторийиндеги ыңгайлуу ачык булак китепканасына - retentioneering-tools. Китепкананы колдонуу кыйын эмес; продукт аналитикасын сүйгөн, бирок мурун код жазбаган дээрлик ар бир адам биздин аналитика ыкмаларын өз маалыматтарына өз алдынча жана олуттуу убакытты жумшабастан колдоно алат.

Программист, тиркемени жаратуучусу же мурда эч качан аналитика жасабаган иштеп чыгуу же тестирлөө тобунун мүчөсү бул код менен ойноп баштай алат жана алардын тиркемесинин колдонуу үлгүлөрүн сырттан жардамсыз көрө алат.

Колдонуучунун траекториясы анализдин негизги элементи жана аны иштетүү ыкмалары катары

Колдонуучунун траекториясы - белгилүү бир убакыт чектеринде колдонуучу мамлекеттеринин ырааттуулугу. Мындан тышкары, окуялар онлайн жана оффлайн режиминде ар кандай маалымат булактарынан болушу мүмкүн. Колдонуучу менен болгон окуялар анын траекториясынын бир бөлүгү болуп саналат. Мисалдар:
• баскычын басты
• сүрөттү көрдүм
• экранга тийиңиз
• электрондук кат алды
• продуктуну досуна сунуштады
• форма толтурулган
• экранды таптады
• жылдырылды
• кассага барды
• бурритого заказ берди
• буррито жеди
• буррито жеп ууланган
• арткы кире бериштен кафеге кирди
• алдыңкы кире бериштен кирди
• колдонмону минималдаштырды
• push эскертме алды
• экранда X караганда узагыраак тыгылып калды
• заказ үчүн төлөнгөн
• заказды сатып алды
• кредит алуудан баш тартты

Эгер сиз колдонуучулардын тобунун траекториясынын маалыматтарын алып, өтүүлөрдүн структурасын изилдеп көрсөңүз, алардын тиркемедеги жүрүм-туруму кандай структураланганын так байкай аласыз. Муну абалдар түйүн, ал эми абалдардын ортосундагы өтүү четтер болгон график аркылуу жасоо ыңгайлуу:

Retentioneering: Python жана Pandas тилдеринде продукт аналитикасы үчүн ачык булактуу куралдарды кантип жаздык

"Траектория" - бул абдан ыңгайлуу түшүнүк - бул колдонуучунун бардык аракеттери жөнүндө толук маалыматты камтыйт, бул аракеттердин сүрөттөлүшүнө кандайдыр бир кошумча маалыматтарды кошуу мүмкүнчүлүгү бар. Бул аны универсалдуу объект кылат. Эгер сизде траекториялар менен иштөөгө мүмкүндүк берүүчү кооз жана ыңгайлуу куралдар болсо, анда окшоштуктарды таап, аларды сегменттерге бөлсөңүз болот.

Траекторияны сегментациялоо башында абдан татаал сезилиши мүмкүн. Кадимки кырдаалда ушундай болот - сиз туташуу матрицасын салыштырууну же ырааттуу тегиздөөнү колдонушуңуз керек. Биз жөнөкөй жолду таба алдык – көп сандагы траекторияларды изилдөө жана кластерлөө аркылуу сегменттөө.

Маалым болгондой, траекторияны үзгүлтүксүз көрсөтүүлөрдү колдонуу менен чекитке айландырууга болот, мисалы, TF-IDF. Трансформациядан кийин траектория мейкиндиктеги чекитке айланат, мында траекториядагы ар кандай окуялардын жана алардын ортосундагы өткөөлдөрдүн нормалдаштырылган көрүнүшү огу боюнча графиги түшүрүлөт. Миң же андан көп өлчөмдүү мейкиндиктеги бул нерсени (dimS=sum(окуянын түрлөрү)+sum(gramms_2 түрлөрү)) жардамы менен учакка проекциялоого болот. TSNE. TSNE - бул мейкиндиктин өлчөмүн 2 огуна чейин азайтуучу жана мүмкүн болсо чекиттердин ортосундагы салыштырмалуу аралыктарды сактаган трансформация. Ушуга ылайык, траекториялардын образдуу проекциялык картасында жалпак картада ар кандай траекториялардын чекиттери өз ара кандайча жайгашканын изилдөө мүмкүн болот. Бул алардын бири-бирине канчалык жакын же айырмаланганын, кластерлерди түзгөнүн же картада чачырап кеткендигин ж.б. талдайт:

Retentioneering: Python жана Pandas тилдеринде продукт аналитикасы үчүн ачык булактуу куралдарды кантип жаздык

Retentioneering аналитика куралдары татаал маалыматтарды жана траекторияларды бири-бири менен салыштыра турган көрүнүшкө айландыруу мүмкүнчүлүгүн камсыз кылат, андан кийин трансформациянын натыйжасын карап чыгууга жана чечмелөөгө болот.

Траекторияларды иштетүүнүн стандарттуу ыкмалары жөнүндө сөз кылып жатып, биз Retentioneering-де ишке ашырган үч негизги инструментти билдирет - графиктер, кадам матрицалары жана траекториянын проекциялык карталары.

Google Analytics, Firebase жана ушул сыяктуу аналитикалык системалар менен иштөө абдан татаал жана 100% эффективдүү эмес. Көйгөй колдонуучу үчүн бир катар чектөөлөр, анын натыйжасында талдоочунун мындай системалардагы иши чычканды чыкылдатуудан жана кесимдерди тандоодон көз каранды. Сактоо Google Analyticsтегидей жөн гана воронкалар менен эмес, колдонуучунун траекториялары менен иштөөгө мүмкүндүк берет, мында деталдардын деңгээли белгилүү бир сегмент үчүн курулса да, көбүнчө воронкага чейин төмөндөйт.

Сактоо жана учурлар

Иштелип чыккан инструментти колдонууга мисал катары биз Россияда чоң кызмат көрсөтүүнү келтирсек болот. Бул компанияда кардарлар арасында популярдуу болгон Android мобилдик тиркемеси бар. Мобилдик тиркеменин жылдык жүгүртүүсү болжол менен 7 миллион рублди түздү, сезондук термелүүлөр 60-130 миңди түздү.Ошол эле компаниянын iOS үчүн тиркемеси да бар жана Apple тиркемесин колдонуучунун орточо эсеби 1080-жылдын орточо эсебине караганда жогору болгон. Android тиркемесин колдонгон кардар - 1300 руб. XNUMX руб.

Компания Android тиркемесинин эффективдүүлүгүн жогорулатууну чечип, ал үчүн кылдат талдоо жүргүзгөн. Колдонмонун натыйжалуулугун жогорулатуу жөнүндө бир нече ондогон гипотезалар түзүлгөн. Retentionneering колдонгондон кийин, көйгөй жаңы колдонуучуларга көрсөтүлгөн билдирүүлөрүндө экени белгилүү болду. Алар бренд, компаниянын артыкчылыктары жана баалары тууралуу маалымат алышты. Бирок, белгилүү болгондой, билдирүүлөр колдонуучуга тиркемеде иштөөнү үйрөнүүгө жардам бериши керек болчу.

Retentioneering: Python жана Pandas тилдеринде продукт аналитикасы үчүн ачык булактуу куралдарды кантип жаздык

Бул жасалды, натыйжада колдонмо азыраак орнотулуп, тартипке өтүүнүн өсүшү 23% ​​түздү. Алгач келген трафиктин 20 пайызы тестирлөөгө берилген, бирок бир нече күндөн кийин биринчи жыйынтыктарды талдап, тенденцияны баалагандан кийин пропорцияларды өзгөртүп, тескерисинче, 20 пайызын контролдук топко калтырышкан жана сексен проценти тестке коюлган. Бир жумадан кийин дагы эки гипотезанын сыналышын ырааттуу түрдө кошуу чечими кабыл алынды. Жети эле жуманын ичинде Android тиркемесинин жүгүртүүсү мурунку деңгээлге салыштырмалуу бир жарым эсеге өстү.

Retentioneering менен кантип иштөө керек?

Биринчи кадамдар абдан жөнөкөй - китепкананы pip install retentioneering буйругу менен жүктөп алыңыз. Репозиторийдин өзү кээ бир продукт аналитика тапшырмалары үчүн дайын мисалдарды жана маалыматтарды иштетүү учурларын камтыйт. Комплект биринчи таанышуу үчүн жетиштүү болгонго чейин дайыма жаңыланып турат. Ар бир адам даяр модулдарды ала алат жана аларды дароо өз милдеттерине колдоно алат - бул аларга колдонуучунун траекторияларын деталдуу талдоо жана оптималдаштыруу процессин мүмкүн болушунча тез жана эффективдүү орнотууга мүмкүндүк берет. Мунун баары так код аркылуу тиркемени колдонуу үлгүлөрүн табууга жана бул тажрыйбаны кесиптештер менен бөлүшүүгө мүмкүндүк берет.

Retentioneering - бул колдонмоңуздун бүткүл мөөнөтүндө колдонууга арзырлык курал, жана бул жерде:

  • Сактоо колдонуучу траекторияларына көз салуу жана үзгүлтүксүз оптималдаштыруу жана бизнестин натыйжалуулугун жогорулатуу үчүн натыйжалуу. Ошентип, жаңы функциялар көп учурда электрондук коммерциялык тиркемелерге кошулат, алардын продуктка тийгизген таасирин дайыма эле туура алдын ала айтуу мүмкүн эмес. Кээ бир учурларда, жаңы жана эски функциялардын ортосунда шайкештик көйгөйлөрү пайда болот - мисалы, жаңылары бар болгондорду "каннибалдаштырат". Жана бул кырдаалда траекторияларды тынымсыз талдоо так зарыл.
  • Жарнамалык каналдар менен иштөөдө да абал окшош: трафиктин жаңы булактары жана жарнамалык чыгармалар тынымсыз текшерилип турат, мезгилдүүлүккө, тенденцияларга жана башка окуялардын таасирине мониторинг жүргүзүү зарыл, бул көйгөйлөрдүн барган сайын жаңы класстарынын пайда болушуна алып келет. Бул ошондой эле колдонуучу механикасын туруктуу мониторинг жана чечмелөөнү талап кылат.
  • Колдонмонун иштешине дайыма таасир этүүчү бир катар факторлор бар. Мисалы, иштеп чыгуучулардын жаңы релиздери: учурдагы көйгөйдү жабуу, алар билбестен эскисин кайтарып беришет же таптакыр жаңысын түзүшөт. Убакыттын өтүшү менен жаңы чыгарылыштардын саны өсүүдө жана каталарды көзөмөлдөө процессин автоматташтыруу керек, анын ичинде колдонуучу траекториясын талдоо.

Жалпысынан алганда, Retentioneering натыйжалуу куралы болуп саналат. Бирок кемчиликсиздиктин чеги жок - аны өркүндөтүүгө, өнүктүрүүгө жана анын негизинде жаңы салкын өнүмдөрдү курууга болот жана керек. Долбоордун коомчулугу канчалык жигердүү болсо, ошончолук айрылар көбөйөт жана аны колдонуунун жаңы кызыктуу варианттары пайда болот.

Retentioneering куралдары жөнүндө көбүрөөк маалымат:

Source: www.habr.com

Комментарий кошуу