リテンション: Python ず Pandas で補品分析甚のオヌプン゜ヌス ツヌルを䜜成した方法

こんにちは、ハブル。 この蚘事では、アプリケヌションたたは Web サむトでのナヌザヌの移動軌跡を凊理するための䞀連の方法ずツヌルの XNUMX 幎間の開発結果を取り䞊げたす。 開発者 - マキシム・ゎゞ、プロダクトクリ゚むタヌチヌムのリヌダヌであり、この蚘事の著者でもありたす。 補品自䜓は Retentioneering ず呌ばれおいたしたが、珟圚はオヌプン゜ヌス ラむブラリに倉換され、誰でも䜿甚できるように Github に公開されおいたす。 これらすべおは、補品およびマヌケティング分析、プロモヌション、補品開発に携わる人々にずっお興味深いものずなるでしょう。 ちなみにハブレでは Retentioneering を䜿甚した事䟋の XNUMX ぀に関する蚘事がすでに公開されおいたす。 新しい資料では、補品で䜕ができるのか、どのように䜿甚できるのかが説明されおいたす。

この蚘事を読んだ埌は、あなた自身が独自のリテンショニアリングを䜜成できるようになりたす。これは、アプリケヌション内およびそれ以降でナヌザヌの軌跡を凊理するための暙準化された方法であれば䜕でもよく、行動の特城を詳现に確認し、そこから成長のための掞察を抜出するこずができたす。ビゞネス指暙の。

リテンションずは䜕ですか?なぜ必芁ですか?

私たちの圓初の目暙は、グロヌスハッキングを「デゞタル魔術」の䞖界から数字、分析、予枬の䞖界に移行させるこずでした。 その結果、補品分析は、空想的な話ではなく数字を奜む人にずっおは玔粋な数孊ずプログラミングに還元され、数匏は「ブランド倉曎」や「ポゞショニング倉曎」などの流行語に還元されたす。蚀葉は聞こえはいいですが、実際にはほずんど圹に立ちたせん。

これらの問題を解決するには、グラフず軌跡による分析のフレヌムワヌクが必芁であり、同時に人間ずロボットの䞡方に理解できる通垞の補品分析タスクを蚘述する方法ずしお、兞型的な分析ルヌチンを簡玠化するラむブラリが必芁でした。 このラむブラリは、ナヌザヌの行動を蚘述し、それを正匏か぀明確な蚀語で補品のビゞネス指暙にリンクする機胜を提䟛するため、開発者やアナリストの日垞的なタスクを簡玠化および自動化し、ビゞネスずのコミュニケヌションを容易にしたす。

リテンションは、あらゆるデゞタル補品 (デゞタル補品に限らず) に適甚しお統合できる手法および分析゜フトりェア ツヌルです。

私たちは 2015 幎にこの補品の開発に取り組み始めたした。 これは、ただ理想的ではありたせんが、デヌタ、sklearn のような API を䜿甚した機械孊習モデル、機械孊習モデル eli5 ず shap の結果を解釈するためのツヌルを操䜜するための、Python ず Pandas の既補のツヌル セットです。

すべおは終わった オヌプンな Github リポゞトリの䟿利なオヌプン゜ヌス ラむブラリぞのリンク - retentioneering-tools。 このラむブラリの䜿甚は難しくありたせん。補品分析は奜きだが、これたでにコヌドを曞いたこずがないほずんどの人が、倚倧な時間を費やすこずなく、独自に分析メ゜ッドをデヌタに適甚できたす。

プログラマヌ、アプリケヌション䜜成者、たたはこれたで分析を行ったこずのない開発チヌムやテスト チヌムのメンバヌは、倖郚からの助けを借りずに、このコヌドを䜿っお遊び始めお、アプリケヌションの䜿甚パタヌンを確認できたす。

分析の基本芁玠ずしおのナヌザヌの軌跡ずその凊理方法

ナヌザヌの軌跡は、特定の時点でのナヌザヌの状態のシヌケンスです。 さらに、むベントはオンラむンずオフラむンの䞡方のさたざたなデヌタ ゜ヌスから取埗される可胜性がありたす。 ナヌザヌに起こる出来事は、ナヌザヌの軌跡の䞀郚です。 䟋:
• ボタンを抌した
• 写真を芋たした
• 画面を叩く
• 電子メヌルを受信したした
• 友人に補品を勧めた
• フォヌムに蚘入したした
• 画面をタップした
• スクロヌル
• レゞに行きたした
• ブリトヌを泚文したした
• ブリトヌを食べた
• ブリトヌを食べお䞭毒になった
• 裏口からカフェに入った
• 正面玄関から入った
• アプリケヌションを最小化したした
• プッシュ通知を受信したした
• X よりも長く画面に留たった
• 泚文の代金を支払いたした
• 泚文を賌入した
• 融資を拒吊された

ナヌザヌのグルヌプの軌跡デヌタを取埗し、遷移がどのように構造化されおいるかを調査するず、アプリケヌション内でのナヌザヌの動䜜がどのように構造化されおいるかを正確に远跡できたす。 これは、状態がノヌドであり、状態間の遷移が゚ッゞであるグラフを通じお行うず䟿利です。

リテンション: Python ず Pandas で補品分析甚のオヌプン゜ヌス ツヌルを䜜成した方法

「軌跡」は非垞に䟿利な抂念です。これには、すべおのナヌザヌのアクションに関する詳现情報が含たれおおり、これらのアクションの説明に远加デヌタを远加できたす。 これにより、普遍的なオブゞェクトになりたす。 軌跡を操䜜できる矎しくお䟿利なツヌルがあれば、類䌌点を芋぀けおセグメント化するこずができたす。

軌跡のセグメンテヌションは、最初は非垞に耇雑に芋えるかもしれたせん。 通垞の状況では、これが圓おはたりたす。接続性行列の比范たたは配列アラむンメントを䜿甚する必芁がありたす。 私たちは、より簡単な方法を芋぀けるこずができたした。それは、倚数の軌跡を研究し、クラスタリングを通じおそれらをセグメント化するずいうものです。

結局のずころ、次のような連続衚珟を䜿甚しお軌跡を点に倉換するこずが可胜です。 TF-IDF。 倉換埌、軌跡は空間内の点になり、軌跡内でのさたざたなむベントの正芏化された発生ずそれらの間の遷移が軞に沿っおプロットされたす。 巚倧な 2 次元以䞊の空間 (dimS=sum(むベント タむプ) + sum(ngrams_XNUMX タむプ)) からのこのものは、次のようにしお平面に投圱できたす。 TSNE。 TSNE は、空間の次元を 2 軞に瞮小し、可胜であれば点間の盞察距離を保存する倉換です。 したがっお、軌跡の比喩的な投圱図である平面地図䞊で、異なる軌跡の点が盞互にどのように配眮されおいるかを研究するこずが可胜になりたす。 それらが互いにどれだけ近いか異なっおいるか、クラスタヌを圢成しおいるかマップ党䜓に分散しおいるかなどを分析したす。

リテンション: Python ず Pandas で補品分析甚のオヌプン゜ヌス ツヌルを䜜成した方法

リテンション分析ツヌルは、耇雑なデヌタず軌跡を盞互に比范できるビュヌに倉換し、倉換の結果を調べお解釈できる機胜を提䟛したす。

軌跡を凊理するための暙準的な方法に぀いお蚀えば、リテンショニアリングに実装した XNUMX ぀の䞻芁なツヌル、぀たりグラフ、ステップ マトリックス、および軌跡投圱マップを意味したす。

Google Analytics、Firebase、および同様の分析システムの操䜜は非垞に耇雑で、100% 効果的ではありたせん。 問題は、ナヌザヌに察する倚くの制限であり、その結果、このようなシステムでのアナリストの䜜業はマりスのクリックずスラむスの遞択に䟝存したす。 リテンションにより、Google アナリティクスのようなファネルだけでなく、ナヌザヌの軌跡も操䜜できるようになりたす。Google アナリティクスでは、特定のセグメント向けに構築されおいるにもかかわらず、詳现レベルがファネルに削枛されるこずがよくありたす。

保持ず事件

開発されたツヌルの䜿甚䟋ずしお、ロシアの倧芏暡なニッチなサヌビスの事䟋を挙げるこずができたす。 この䌚瀟は、顧客の間で人気のある Android モバむル アプリケヌションを提䟛しおいたす。 モバむル アプリケヌションの幎間売䞊高は玄 7 䞇ルヌブルで、季節倉動は 60 䞇から 130 䞇ルヌブルでした。同じ䌚瀟は iOS 甚のアプリケヌションも提䟛しおおり、Apple アプリケヌションのナヌザヌの平均請求額は、Apple のナヌザヌの平均請求額よりも高かったのです。 Android アプリケヌションを䜿甚するクラむアント - 1080 Rub。 察1300摩擊。

同瀟は Android アプリケヌションの効率を向䞊させるこずを決定し、培底的な分析を実斜したした。 アプリケヌションの有効性の向䞊に関しお、数十の仮説が生成されたした。 Retentionneering を䜿甚した埌、問題は新芏ナヌザヌに衚瀺されるメッセヌゞにあるこずが刀明したした。 圌らはブランド、䌚瀟の特兞、䟡栌に関する情報を受け取りたした。 しかし、結局のずころ、メッセヌゞはナヌザヌがアプリケヌションでの䜜業方法を孊ぶのに圹立぀はずでした。

リテンション: Python ず Pandas で補品分析甚のオヌプン゜ヌス ツヌルを䜜成した方法

これが行われた結果、アプリケヌションのアンむンストヌルが枛り、泚文ぞのコンバヌゞョンが 23% 増加したした。 最初は、受信トラフィックの 20 パヌセントがテストに䞎えられたしたが、数日埌、最初の結果を分析しお傟向を評䟡した埌、比率を逆転させ、逆に 20 パヌセントを察照グルヌプに残したした。 XNUMXパヌセントがテストに合栌したした。 XNUMX 週間埌、さらに XNUMX ぀の仮説のテストを順次远加するこずが決定されたした。 わずか XNUMX 週間で、Android アプリケヌションの売䞊高は以前のレベルず比范しお XNUMX 倍に増加したした。

リテンションず連携するにはどうすればよいですか?

最初の手順は非垞に簡単です。pip install restarteering コマンドを䜿甚しおラむブラリをダりンロヌドしたす。 リポゞトリ自䜓には、䞀郚の補品分析タスクのデヌタ凊理の既補のサンプルずケヌスが含たれおいたす。 このセットは、初めお知る人にずっお十分なものになるたで、垞に曎新されたす。 誰でも既補のモゞュヌルを取埗しお自分のタスクにすぐに適甚できたす。これにより、ナヌザヌの軌跡のより詳现な分析ず最適化のプロセスをできるだけ迅速か぀効率的にセットアップできたす。 これらすべおにより、明確なコヌドを通じおアプリケヌションの䜿甚パタヌンを芋぀け、この゚クスペリ゚ンスを同僚ず共有するこずが可胜になりたす。

リテンションはアプリケヌションの存続期間䞭ずっず䜿甚する䟡倀のあるツヌルです。その理由は次のずおりです。

  • リテンションは、ナヌザヌの軌跡を远跡しお継続的に最適化し、ビゞネス パフォヌマンスを向䞊させるのに効果的です。 したがっお、新しい機胜が e コマヌス アプリケヌションに远加されるこずがよくありたすが、その機胜が補品に䞎える圱響を垞に正確に予枬できるずは限りたせん。 堎合によっおは、新しい関数ず叀い関数の間で互換性の問題が発生するこずがありたす。たずえば、新しい関数が既存の関数を「共食い」したす。 この状況では、軌道を継続的に分析するこずがたさに必芁ずなりたす。
  • 広告チャネルを扱う堎合も状況は同様です。新しいトラフィック ゜ヌスず広告クリ゚むティブは垞にテストされおおり、季節性、傟向、その他のむベントの圱響を監芖する必芁があり、その結果、たすたす新しい皮類の問題が発生したす。 これには、ナヌザヌの仕組みを垞に監芖し解釈するこずも必芁です。
  • アプリケヌションのパフォヌマンスに垞に圱響を䞎える芁因は数倚くありたす。 たずえば、開発者からの新しいリリヌス: 珟圚の問題を解決するず、知らず知らずのうちに叀い問題が返されたり、たったく新しい問題が䜜成されたりしたす。 時間が経぀に぀れお、新しいリリヌスの数が増加するため、ナヌザヌの軌跡を分析するなど、゚ラヌを远跡するプロセスを自動化する必芁がありたす。

党䜓ずしお、リテンションは効果的なツヌルです。 しかし、完璧には限界がありたせん。それをベヌスに改良、開発、構築される新しい優れた補品は可胜ですし、そうすべきです。 プロゞェクトのコミュニティが掻発であればあるほど、より倚くのフォヌクが存圚し、それを䜿甚するための新しい興味深いオプションが衚瀺されたす。

リテンションツヌルの詳现情報:

出所 habr.com

コメントを远加したす