Պահպանում. ինչպես ենք մենք գրել բաց կոդով գործիքներ՝ Python-ում և Pandas-ում արտադրանքի վերլուծության համար

Բարև, Հաբր: Այս հոդվածը նվիրված է հավելվածում կամ վեբկայքում օգտատերերի շարժման հետագծերի մշակման մեթոդների և գործիքների համալիր մշակման չորս տարվա արդյունքներին: Մշակման հեղինակ - Մաքսիմ Գոդզի, ով գլխավորում է արտադրանք ստեղծողների թիմը և նաև հոդվածի հեղինակն է։ Ապրանքն ինքնին կոչվում էր Retentioneering, այն այժմ վերածվել է բաց կոդով գրադարանի և տեղադրվել Github-ում, որպեսզի բոլորը կարողանան օգտագործել այն: Այս ամենը կարող է հետաքրքրել նրանց, ովքեր ներգրավված են արտադրանքի և մարքեթինգի վերլուծության, առաջխաղացման և արտադրանքի մշակման մեջ: Ի դեպ, Հաբրեում Retaineering-ի հետ աշխատելու դեպքերից մեկի մասին արդեն հոդված է հրապարակվել. Նոր նյութը բացատրում է, թե ինչ կարող է անել արտադրանքը և ինչպես կարող է այն օգտագործվել:

Հոդվածը կարդալուց հետո դուք ինքներդ կկարողանաք գրել ձեր սեփական Retaineering-ը, այն կարող է լինել ցանկացած ստանդարտացված մեթոդ՝ հավելվածում և դրանից դուրս օգտագործողների հետագծերի մշակման համար, որը թույլ է տալիս մանրամասնորեն տեսնել վարքագծի առանձնահատկությունները և դրանից պատկերացումներ քաղել աճի համար: բիզնեսի չափորոշիչներ:

Ի՞նչ է պահպանումը և ինչու է այն անհրաժեշտ:

Մեր սկզբնական նպատակն էր Growth Hacking-ը «թվային կախարդության» աշխարհից տեղափոխել թվերի, վերլուծությունների և կանխատեսումների աշխարհ: Որպես հետևանք, արտադրանքի վերլուծությունը վերածվում է մաքուր մաթեմատիկայի և ծրագրավորման նրանց համար, ովքեր նախընտրում են թվեր՝ ֆանտաստիկ պատմությունների փոխարեն, և բանաձևերը՝ որպես «ռեբրենդինգ», «վերաբաշխում» և այլն բառերի փոխարեն, որոնք գեղեցիկ են հնչում, բայց գործնականում քիչ են օգնում:

Այս խնդիրները լուծելու համար մեզ անհրաժեշտ էր գրաֆիկների և հետագծերի միջոցով վերլուծության շրջանակ, և միևնույն ժամանակ գրադարան, որը պարզեցնում է սովորական վերլուծաբանների առօրյան՝ որպես արտադրանքի վերլուծության կանոնավոր առաջադրանքները նկարագրելու միջոց, որը հասկանալի կլինի և՛ մարդկանց, և՛ ռոբոտներին: Գրադարանը հնարավորություն է տալիս նկարագրել օգտատերերի վարքագիծը և այն կապել արտադրանքի բիզնեսի չափումների հետ այնպիսի պաշտոնական և հստակ լեզվով, որ այն պարզեցնում և ավտոմատացնում է մշակողների և վերլուծաբանների առօրյա խնդիրները և հեշտացնում է նրանց հաղորդակցությունը բիզնեսի հետ:

Retaineering-ը մեթոդ և վերլուծական ծրագրային գործիքներ է, որոնք կարող են հարմարեցվել և ինտեգրվել ցանկացած թվային (և ոչ միայն) արտադրանքի մեջ:

Ապրանքի վրա սկսել ենք աշխատել 2015թ. Այժմ սա պատրաստի, թեև դեռ իդեալական չէ Python-ի և Panda-ի գործիքների հավաքածու է տվյալների հետ աշխատելու համար, մեքենայական ուսուցման մոդելներ sklearn-ի նման api-ով, գործիքներ մեքենայական ուսուցման մոդելների արդյունքները մեկնաբանելու համար eli5 և shap:

Ամեն ինչ ավարտված է դեպի հարմար բաց կոդով գրադարան բաց Github պահոցում - retentioneering-tools. Գրադարանից օգտվելը դժվար չէ. գրեթե յուրաքանչյուր ոք, ով սիրում է արտադրանքի վերլուծությունը, բայց նախկինում չի գրել կոդ, կարող է կիրառել մեր վերլուծական մեթոդներն իրենց տվյալների վրա ինքնուրույն և առանց ժամանակի զգալի ներդրումների:

Դե, ծրագրավորողը, հավելված ստեղծողը կամ մշակման կամ թեստավորման թիմի անդամը, ով նախկինում երբեք վերլուծություն չի արել, կարող է սկսել խաղալ այս կոդով և տեսնել իրենց հավելվածի օգտագործման օրինաչափությունները՝ առանց արտաքին օգնության:

Օգտագործողի հետագիծը որպես վերլուծության հիմնական տարր և դրա մշակման մեթոդներ

Օգտագործողի հետագիծը որոշակի ժամանակային կետերում օգտագործողի վիճակների հաջորդականությունն է: Ավելին, իրադարձությունները կարող են լինել տարբեր տվյալների աղբյուրներից՝ ինչպես առցանց, այնպես էլ օֆլայն: Օգտատիրոջ հետ պատահած իրադարձությունները նրա հետագծի մի մասն են: Օրինակներ.
• սեղմել է կոճակը
• տեսել է նկարը
• հարվածել էկրանին
• նամակ է ստացել
• ապրանքն առաջարկել է ընկերոջը
• լրացրել է ձևաթուղթը
• դիպչել է էկրանին
• ոլորված
• գնացել է դրամարկղ
• պատվիրել է բուրիտո
• կերել է բուրիտո
• թունավորվել է բուրիտո ուտելով
• սրճարան մտել է հետնամուտքից
• մուտք է գործել դիմացի մուտքից
• նվազագույնի հասցրեց հավելվածը
• ստացել է push ծանուցում
• խրված էր էկրանին X-ից ավելի երկար
• վճարել է պատվերի համար
• գնել է պատվերը
• մերժվել է վարկ

Եթե ​​վերցնեք մի խումբ օգտատերերի հետագծի տվյալները և ուսումնասիրեք, թե ինչպես են կառուցված անցումները, կարող եք հստակ հետևել, թե ինչպես է կառուցված նրանց վարքագիծը հավելվածում: Հարմար է դա անել գրաֆիկի միջոցով, որտեղ վիճակները հանգույցներ են, իսկ վիճակների միջև անցումները՝ եզրեր.

Պահպանում. ինչպես ենք մենք գրել բաց կոդով գործիքներ՝ Python-ում և Pandas-ում արտադրանքի վերլուծության համար

«Հետագիծը» շատ հարմար հայեցակարգ է. այն պարունակում է մանրամասն տեղեկատվություն օգտվողի բոլոր գործողությունների մասին՝ այս գործողությունների նկարագրությանը լրացուցիչ տվյալներ ավելացնելու հնարավորությամբ: Սա այն դարձնում է ունիվերսալ օբյեկտ: Եթե ​​ունեք գեղեցիկ և հարմար գործիքներ, որոնք թույլ են տալիս աշխատել հետագծերի հետ, ապա կարող եք գտնել նմանություններ և հատվածավորել դրանք:

Հետագծի հատվածավորումը սկզբում կարող է շատ բարդ թվալ: Նորմալ իրավիճակում դա այդպես է. դուք պետք է օգտագործեք կապի մատրիցային համեմատություն կամ հաջորդականության հավասարեցում: Մեզ հաջողվեց գտնել ավելի պարզ միջոց՝ ուսումնասիրել մեծ թվով հետագծեր և դրանք բաժանել կլաստերավորման միջոցով։

Ինչպես պարզվեց, հնարավոր է հետագիծը վերածել կետի, օգտագործելով շարունակական ներկայացումներ, օրինակ. TF-IDF. Փոխակերպումից հետո հետագիծը դառնում է տարածության մի կետ, որտեղ գծագրվում է առանցքների երկայնքով տարբեր իրադարձությունների և դրանց միջև անցումների նորմալացված առաջացումը հետագծի մեջ: Այս բանը հսկայական հազար կամ ավելի ծավալային տարածությունից (dimS=sum(իրադարձության տեսակներ)+գումար(ngrams_2 տեսակներ)) կարող է նախագծվել հարթության վրա՝ օգտագործելով TSNE. TSNE-ը փոխակերպում է, որը նվազեցնում է տարածության չափը մինչև 2 առանցք և, հնարավորության դեպքում, պահպանում է կետերի միջև հարաբերական հեռավորությունները: Համապատասխանաբար, հնարավոր է դառնում հարթ քարտեզի վրա, հետագծերի պատկերավոր պրոյեկցիոն քարտեզի վրա, ուսումնասիրել, թե ինչպես են տարբեր հետագծերի կետերը գտնվում միմյանց միջև: Այն վերլուծում է, թե որքան մոտ կամ տարբեր էին նրանք միմյանց հետ, արդյոք նրանք կազմեցին կլաստերներ, թե ցրված էին քարտեզի վրա և այլն:

Պահպանում. ինչպես ենք մենք գրել բաց կոդով գործիքներ՝ Python-ում և Pandas-ում արտադրանքի վերլուծության համար

Retaineering վերլուծական գործիքները հնարավորություն են տալիս բարդ տվյալներն ու հետագծերը վերածել տեսակետի, որը կարելի է համեմատել միմյանց հետ, այնուհետև վերափոխման արդյունքը կարող է ուսումնասիրվել և մեկնաբանվել:

Խոսելով հետագծերի մշակման ստանդարտ մեթոդների մասին՝ մենք նկատի ունենք երեք հիմնական գործիքներ, որոնք մենք ներդրել ենք Retentioneering-ում՝ գրաֆիկները, քայլերի մատրիցները և հետագծի պրոյեկցիոն քարտեզները:

Google Analytics, Firebase և նմանատիպ վերլուծական համակարգերի հետ աշխատելը բավականին բարդ է և ոչ 100% արդյունավետ: Խնդիրն օգտագործողի համար մի շարք սահմանափակումներ են, որոնց արդյունքում վերլուծաբանի աշխատանքը նման համակարգերում կախված է մկնիկի սեղմումներից և հատվածների ընտրությունից: Retaineering-ը հնարավորություն է տալիս աշխատել օգտատերերի հետագծերի, և ոչ միայն ձագարների հետ, ինչպես Google Analytics-ում, որտեղ մանրամասնության մակարդակը հաճախ կրճատվում է մինչև ձագար, թեև կառուցված է որոշակի հատվածի համար:

Պահպանում և գործեր

Որպես մշակված գործիքի օգտագործման օրինակ, մենք կարող ենք մեջբերել Ռուսաստանում խոշոր նիշային ծառայության դեպքը: Այս ընկերությունն ունի Android բջջային հավելված, որը հայտնի է հաճախորդների շրջանում: Բջջային հավելվածից տարեկան շրջանառությունը կազմել է մոտ 7 մլն ռուբլի, սեզոնային տատանումները տատանվել են 60-130 հազարի սահմաններում։ Android հավելվածն օգտագործող հաճախորդ - 1080 ռուբ. 1300 ռուբի դիմաց:

Ընկերությունը որոշել է բարձրացնել Android հավելվածի արդյունավետությունը, ինչի համար կատարել է մանրակրկիտ վերլուծություն։ Մի քանի տասնյակ վարկածներ ստեղծվեցին հավելվածի արդյունավետության բարձրացման վերաբերյալ։ Retentionneering-ն օգտագործելուց հետո պարզվեց, որ խնդիրը նոր օգտատերերին ցուցադրվող հաղորդագրությունների մեջ է։ Նրանք տեղեկատվություն են ստացել ապրանքանիշի, ընկերության առավելությունների և գների մասին: Սակայն, ինչպես պարզվեց, հաղորդագրությունները պետք է օգնեին օգտատերին սովորել, թե ինչպես աշխատել հավելվածում։

Պահպանում. ինչպես ենք մենք գրել բաց կոդով գործիքներ՝ Python-ում և Pandas-ում արտադրանքի վերլուծության համար

Դա արվել է, ինչի արդյունքում հավելվածն ավելի քիչ տեղահանվել է, իսկ պատվերի փոխակերպման աճը կազմել է 23%: Սկզբում մուտքային տրաֆիկի 20 տոկոսը տրվել է թեստին, բայց մի քանի օր հետո, առաջին արդյունքները վերլուծելուց և միտումը գնահատելուց հետո, նրանք հակադարձել են համամասնությունները և, ընդհակառակը, 20 տոկոսը թողել են վերահսկիչ խմբին, և ութսուն տոկոսը տեղ է գտել թեստում: Մեկ շաբաթ անց որոշվեց հաջորդաբար ավելացնել ևս երկու վարկածների փորձարկում։ Ընդամենը յոթ շաբաթվա ընթացքում Android հավելվածի շրջանառությունը նախորդ մակարդակի համեմատ ավելացել է մեկուկես անգամ։

Ինչպե՞ս աշխատել Retaineering-ի հետ:

Առաջին քայլերը բավականին պարզ են՝ ներբեռնեք գրադարանը pip install retentioneering հրամանով: Պահեստն ինքնին պարունակում է արտադրանքի վերլուծության որոշ առաջադրանքների համար տվյալների մշակման պատրաստի օրինակներ և դեպքեր: Հավաքածուն անընդհատ թարմացվում է, քանի դեռ այն բավարար է առաջին ծանոթության համար։ Յուրաքանչյուրը կարող է վերցնել պատրաստի մոդուլներ և անմիջապես կիրառել դրանք իրենց առաջադրանքների մեջ. սա նրանց թույլ է տալիս անմիջապես կարգավորել օգտվողների հետագծերի ավելի մանրամասն վերլուծության և օպտիմալացման գործընթացը հնարավորինս արագ և արդյունավետ: Այս ամենը հնարավորություն է տալիս պարզ կոդի միջոցով գտնել հավելվածների օգտագործման օրինաչափություններ և կիսվել այս փորձով գործընկերների հետ:

Retaineering-ը գործիք է, որն արժե օգտագործել ձեր հավելվածի ողջ կյանքի ընթացքում, և ահա թե ինչու.

  • Retaineering-ը արդյունավետ է օգտագործողների հետագծերը հետևելու և շարունակաբար օպտիմալացնելու և բիզնեսի կատարողականը բարելավելու համար: Այսպիսով, էլեկտրոնային առևտրի հավելվածներին հաճախ ավելանում են նոր հնարավորություններ, որոնց ազդեցությունը արտադրանքի վրա միշտ չէ, որ ճիշտ կանխատեսել։ Որոշ դեպքերում համատեղելիության խնդիրներ են առաջանում նոր և հին գործառույթների միջև, օրինակ՝ նորերը «կանիբալացնում են» գոյություն ունեցողները: Եվ այս իրավիճակում հետագծերի մշտական ​​վերլուծությունը հենց այն է, ինչ անհրաժեշտ է։
  • Իրավիճակը նման է գովազդային ալիքների հետ աշխատելիս. թրաֆիկի նոր աղբյուրները և գովազդային կրեատիվները մշտապես փորձարկվում են, անհրաժեշտ է վերահսկել սեզոնայնությունը, միտումները և այլ իրադարձությունների ազդեցությունը, ինչը հանգեցնում է խնդիրների ավելի ու ավելի նոր դասերի առաջացմանը: Սա նաև պահանջում է օգտագործողի մեխանիկայի մշտական ​​մոնիտորինգ և մեկնաբանում:
  • Կան մի շարք գործոններ, որոնք մշտապես ազդում են հավելվածի աշխատանքի վրա: Օրինակ՝ ծրագրավորողների նոր թողարկումները՝ փակելով ընթացիկ խնդիրը, նրանք ակամա վերադարձնում են հինը կամ ստեղծում են բոլորովին նորը։ Ժամանակի ընթացքում նոր թողարկումների թիվն աճում է, և սխալներին հետևելու գործընթացը պետք է ավտոմատացվի, այդ թվում՝ օգտագործողների հետագծերի վերլուծության միջոցով:

Ընդհանուր առմամբ, Retaineering-ը արդյունավետ գործիք է: Բայց կատարելության սահման չկա. այն կարող է և պետք է բարելավվի, մշակվի և դրա հիման վրա ստեղծվի նոր զով արտադրանք: Որքան ակտիվ լինի նախագծի համայնքը, այնքան շատ պատառաքաղներ կլինեն, և կհայտնվեն այն օգտագործելու նոր հետաքրքիր տարբերակներ:

Լրացուցիչ տեղեկություններ Retaineering գործիքների մասին.

Source: www.habr.com

Добавить комментарий