ساتل: څنګه موږ په پایتون او پانډاس کې د محصول تحلیلونو لپاره د خلاصې سرچینې وسیلې لیکلي

سلام، حبر. دا مقاله په غوښتنلیک یا ویب پا onه کې د کارونکي حرکت حرکتونو پروسس کولو لپاره د میتودونو او وسیلو سیټ د څلورو کلونو پراختیا پایلو ته وقف شوې. د پرمختګ لیکوال - ماکسیم ګوډزی، څوک چې د محصول جوړونکو ټیم مشري کوي او د مقالې لیکوال هم دی. محصول پخپله د Retentioneering په نوم یادیږي؛ دا اوس په خلاصې سرچینې کتابتون کې بدل شوی او په ګیتوب کې پوسټ شوی ترڅو هرڅوک یې وکاروي. دا ټول ممکن د هغو کسانو لپاره په زړه پورې وي چې د محصول او بازار موندنې تحلیل، ترویج او د محصول پراختیا کې ښکیل دي. په لاره کې، په Habré کې یوه مقاله لا دمخه د ساتیرۍ سره د کار کولو قضیې په اړه خپره شوې. نوی مواد تشریح کوي چې محصول څه شی کولی شي او دا څنګه کارول کیدی شي.

د مقالې لوستلو وروسته ، تاسو به پخپله وکولی شئ خپل ځان ساتنه ولیکئ؛ دا په غوښتنلیک او هاخوا کې د کارونکي ټراجیکټرونو پروسس کولو لپاره هر ډول معیاري میتود کیدی شي ، تاسو ته اجازه درکوي د چلند ځانګړتیاوې په تفصیل سره وګورئ او د ودې لپاره له دې څخه بصیرتونه استخراج کړئ. د سوداګرۍ میټریکونو

ساتل څه شی دی او ولې ورته اړتیا ده؟

زموږ لومړنی هدف د "ډیجیټل جادوګرۍ" نړۍ څخه د شمیرو ، تحلیلونو او وړاندوینو نړۍ ته د ودې هیکینګ حرکت کول وو. د پایلې په توګه، د محصول تحلیلونه د هغو کسانو لپاره خالص ریاضیاتو او برنامه کولو ته راټیټ شوي څوک چې د غوره کیسې پرځای شمیرې غوره کوي ، او د "بیا برانډینګ" ، "بیا ځای کول" او داسې نورو ته فورمولونه غوره کوي ، کوم چې ښه ښکاري ، مګر په عمل کې لږ مرسته کوي.

د دې ستونزو د حل لپاره، موږ د ګرافونو او لارو چارو له لارې د تحلیلونو لپاره یو چوکاټ ته اړتیا درلوده، او په ورته وخت کې یو کتابتون چې د شنونکي معمول معمولونه ساده کوي، د منظم محصول تحلیلي دندو تشریح کولو لپاره د یوې لارې په توګه چې د خلکو او روبوټونو دواړو لپاره د پوهیدو وړ وي. کتابتون د دې وړتیا چمتو کوي چې د کارونکي چلند تشریح کړي او دا په داسې رسمي او روښانه ژبه کې د محصول سوداګرۍ میټریکونو سره ونښلوي چې دا د پراختیا کونکو او شنونکو عادي دندې ساده او اتومات کوي ، او د سوداګرۍ سره د دوی اړیکې اسانه کوي.

ساتل یو میتود او تحلیلي سافټویر اوزار دی چې کولی شي په هر ډیجیټل (او نه یوازې) محصول کې تطبیق او مدغم شي.

موږ په 2015 کې په محصول کار پیل کړ. اوس دا یو چمتو شوی دی، که څه هم لا تر اوسه مثالی نه دی، د ډیټا سره کار کولو لپاره په Python او Pandas کې د وسیلو سیټ، د sklearn-like api سره د ماشین زده کړې ماډلونه، د ماشین زده کړې ماډلونو eli5 او shap د پایلو تشریح کولو وسیلې.

دا ټول په ټپه ولاړ دي په خلاص ګیتوب ذخیره کې د خلاصې سرچینې کتابتون ته - د ساتلو وسیلې. د کتابتون کارول ستونزمن نه دي؛ نږدې هرڅوک چې د محصول تحلیلونو سره مینه لري، مګر مخکې یې کوډ نه دی لیکلی، کولی شي زموږ د تحلیل میتودونه په خپلواکه توګه او د پام وړ وخت پانګوونې پرته د دوی ډیټا کې پلي کړي.

ښه، یو برنامه جوړونکی، د اپلیکیشن جوړونکی، یا د پراختیا یا ازموینې ټیم غړی چې مخکې یې هیڅکله تحلیلونه ندي کړي کولی شي د دې کوډ سره لوبې پیل کړي او د بهر مرستې پرته د دوی غوښتنلیک کارولو نمونې وګوري.

د پروسس کولو لپاره د تحلیل او میتودونو د بنسټیز عنصر په توګه د کارونکي لار

د کارن تګلارې په ټاکلو وختونو کې د کارونکي حالتونو لړۍ ده. سربیره پردې ، پیښې کولی شي د مختلف ډیټا سرچینو څخه راشي ، دواړه آنلاین او آفلاین. هغه پیښې چې کارونکي ته پیښیږي د هغه د تګ برخه ده. بېلګې:
• تڼۍ فشار کړئ
• انځور ولید
• پرده ووهئ
• بریښنالیک ترلاسه کړ
• یو ملګري ته محصول وړاندیز کړی
• فورمه ډکه کړه
• پرده ټایپ کړه
• سکرول شوی
• د نغدو راجستر ته لاړ
• د burrito امر وکړ
• بوریټو وخوړل
• د بوریټو په خوړلو مسموم شوی
• کیفې ته له شاته ننوتل
• د مخکنۍ دروازې څخه ننوتل
• غوښتنلیک لږ کړی
• د فشار خبرتیا ترلاسه کړه
• د X څخه ډیر اوږد په سکرین کې ودرول شو
• د امر لپاره پیسې ورکړل شوې
• امر یې اخیستی
• پور رد شو

که تاسو د کاروونکو د یوې ډلې ټراجیکوري ډیټا واخلئ او مطالعه کړئ چې لیږدونه څنګه تنظیم شوي ، تاسو کولی شئ دقیقا ومومئ چې څنګه په غوښتنلیک کې د دوی چلند جوړښت شوی. دا اسانه ده چې دا د ګراف له لارې ترسره کړئ په کوم کې چې ایالتونه نوډونه دي، او د دولتونو ترمنځ لیږدونه څنډې دي:

ساتل: څنګه موږ په پایتون او پانډاس کې د محصول تحلیلونو لپاره د خلاصې سرچینې وسیلې لیکلي

"تجارت" یو خورا اسانه مفهوم دی - دا د ټولو کاروونکو کړنو په اړه مفصل معلومات لري، د دې وړتیا سره چې د دې کړنو توضیحاتو کې اضافي معلومات اضافه کړي. دا یو نړیوال څیز جوړوي. که تاسو ښکلي او مناسب وسیلې لرئ چې تاسو ته اجازه درکوي د ټراجیکټرونو سره کار وکړئ ، نو تاسو ورته ورته والی ومومئ او برخې یې کړئ.

په لومړي سر کې د ټراکټوري قطع کول ممکن خورا پیچلي ښکاري. په نورمال حالت کې، دا قضیه ده - تاسو اړتیا لرئ د ارتباط میټرکس پرتله یا د ترتیب ترتیب وکاروئ. موږ د یوې ساده لارې په موندلو کې بریالي شو - د لوی شمیر ټراجکټوریو مطالعه کول او د کلستر کولو له لارې طبقه بندي کول.

لکه څنګه چې دا معلومه شوه، دا ممکنه ده چې د پرله پسې نمایندګیو په کارولو سره یو ټکي په یوه نقطه بدل کړئ، د بیلګې په توګه، TF-IDF. د بدلون څخه وروسته، ټراجکټوري په فضا کې په یوه نقطه بدلیږي چیرې چې د مختلف پیښو معمول شوي پیښې او د دوی تر مینځ لیږد په ټراجکټوري کې د محورونو سره پلټل کیږي. دا شی د لوی زره ​​یا ډیر ابعادي ځای څخه (dimS=sum (د پیښې ډولونه) + sum (ngrams_2 ډولونه)) په کارولو سره الوتکې ته وړاندی کیدی شي TSNE. TSNE یو بدلون دی چې د ځای ابعاد 2 محورونو ته راټیټوي او که ممکنه وي، د نقطو ترمنځ نسبتا فاصله ساتي. په دې اساس، دا په یوه فلیټ نقشه کې ممکنه ده، د ټراجکټریزونو انځوري پروژیکیشن نقشه، دا مطالعه کول چې څنګه د بیلابیلو لارو ټکي په خپل منځ کې موقعیت لري. دا تحلیل کوي چې دوی یو بل ته څومره نږدې یا مختلف وو، ایا دوی کلسترونه جوړ کړي یا په نقشه کې ویشل شوي، او داسې نور:

ساتل: څنګه موږ په پایتون او پانډاس کې د محصول تحلیلونو لپاره د خلاصې سرچینې وسیلې لیکلي

د ساتلو تحلیلي وسیلې د دې وړتیا چمتو کوي چې پیچلي ډیټا او ټراجیکټریزونه په لید کې بدل کړي چې د یو بل سره پرتله کیدی شي ، او بیا د بدلون پایله معاینه او تشریح کیدی شي.

د ټراجکټوریو پروسس کولو لپاره د معیاري میتودونو په اړه خبرې کول، زموږ مطلب دا دی چې درې اصلي وسیلې چې موږ یې په ساتلو کې پلي کړي دي - ګرافونه، مرحله میټریکونه او د ټراجیکوري پروجیکشن نقشې.

د Google Analytics، Firebase او ورته تحلیلي سیسټمونو سره کار کول خورا پیچلي دي او 100٪ اغیزمن ندي. ستونزه د کارونکي لپاره یو شمیر محدودیتونه دي، چې په پایله کې یې په داسې سیسټمونو کې د شنونکي کار د موږک کلیکونو او د ټوټو انتخاب پورې اړه لري. ساتل دا ممکنه کوي چې د کارونکي ټراجیکټرونو سره کار وکړي، نه یوازې د فنلونو سره، لکه څنګه چې په ګوګل انلاینز کې، چیرې چې د توضیحاتو کچه اکثرا یو فینل ته راټیټه کیږي، که څه هم د یوې ځانګړې برخې لپاره جوړ شوی.

ساتل او قضیې

د پرمختللې وسیلې کارولو مثال په توګه ، موږ کولی شو په روسیه کې د لوی طاق خدمت قضیه په ګوته کړو. دا شرکت د Android موبایل اپلیکیشن لري چې د پیرودونکو ترمنځ مشهور دی. د ګرځنده اپلیکیشن څخه کلنی عاید شاوخوا 7 ملیون روبیل و، موسمي بدلونونه یې له 60-130 زرو پورې وو، ورته شرکت د iOS لپاره هم یو اپلیکیشن لري، او د ایپل اپلیکیشن د کاروونکي اوسط بیل د اوسط بل څخه لوړ و. یو پیرودونکی چې د Android غوښتنلیک کاروي - 1080 روب. د 1300 روبلو په مقابل کې.

شرکت پریکړه وکړه چې د Android غوښتنلیک موثریت زیات کړي، د کوم لپاره چې دا یو بشپړ تحلیل ترسره کړ. د غوښتنلیک د اغیزمنتیا د زیاتوالي په اړه څو درجن فرضیې رامینځته شوي. د Retentionneering کارولو وروسته، دا معلومه شوه چې ستونزه په پیغامونو کې وه چې نوي کاروونکو ته ښودل شوي. دوی د برانډ، شرکت ګټو او قیمتونو په اړه معلومات ترلاسه کړل. مګر، لکه څنګه چې دا معلومه شوه، پیغامونه باید د کاروونکي سره مرسته وکړي چې څنګه په غوښتنلیک کې کار وکړي.

ساتل: څنګه موږ په پایتون او پانډاس کې د محصول تحلیلونو لپاره د خلاصې سرچینې وسیلې لیکلي

دا ترسره شو، په پایله کې چې غوښتنلیک لږ غیر نصب شو، او په ترتیب کې د تبادلې زیاتوالی 23٪ و. په لومړي سر کې، د راتلونکو ټرافیک 20 سلنه ازموینې ته ورکړل شوی و، مګر څو ورځې وروسته، د لومړنیو پایلو تحلیل او د رجحان ارزولو وروسته، دوی تناسب بیرته واخیست او په برعکس، د کنټرول ګروپ لپاره 20 سلنه پریښوده، او اتیا سلنه په ازموینه کې ځای شوي. یوه اونۍ وروسته ، پریکړه وشوه چې په ترتیب سره د دوه نورو فرضیو ازموینې اضافه کړي. یوازې په اوو اونیو کې، د Android اپلیکیشن څخه تبادله د تیرې کچې په پرتله یو نیم چنده زیاته شوې.

د Retentioneering سره څنګه کار وکړو؟

لومړۍ مرحلې خورا ساده دي - د پایپ انسټال ساتلو کمانډ سره کتابتون ډاونلوډ کړئ. ذخیره پخپله د محصول تحلیلي کارونو لپاره چمتو شوي مثالونه او د ډیټا پروسس کولو قضیې لري. سیټ په دوامداره توګه تازه کیږي تر هغه چې دا د لومړي پیژندونکي لپاره کافي وي. هرڅوک کولی شي چمتو شوي ماډلونه واخلي او سمدلاسه یې په خپلو دندو کې پلي کړي - دا دوی ته اجازه ورکوي چې ژر تر ژره د امکان تر حده ګړندي او مؤثره د کارونکي تګلارې اصلاح او د نورو مفصلو تحلیلونو پروسه تنظیم کړي. دا ټول دا ممکنه کوي چې د واضح کوډ له لارې د غوښتنلیک کارولو نمونې ومومئ او دا تجربه د همکارانو سره شریک کړئ.

ساتل ستاسو د غوښتنلیک په ټول ژوند کې د کارولو وړ وسیله ده، او دلته ولې:

  • ساتل د کارونکي تګلارې تعقیب او په دوامداره توګه اصلاح کولو او د سوداګرۍ فعالیت ښه کولو لپاره مؤثره دي. پدې توګه ، نوي ب featuresې اکثرا د ای کامرس غوښتنلیکونو کې اضافه کیږي ، د کوم اغیز چې په محصول باندې تل په سمه توګه وړاندوینه نشي کیدی. په ځینو مواردو کې، د مطابقت ستونزې د نویو او زړو دندو تر مینځ رامینځته کیږي - د بیلګې په توګه، نوي د موجوده موجوداتو "کنابالیز" کوي. او په دې حالت کې، د ټراجکټوریز دوامداره تحلیل دقیقا هغه څه دي چې ورته اړتیا ده.
  • وضعیت ورته دی کله چې د اعلاناتو چینلونو سره کار کول: نوي ترافیک سرچینې او د اعلاناتو تخلیق کونکي په دوامداره توګه ازمول کیږي ، دا اړینه ده چې د موسمیاتو ، تمایلاتو او نورو پیښو اغیز وڅارئ ، کوم چې د ستونزو ډیری نوي ټولګیو رامینځته کیدو لامل کیږي. دا د کارونکي میخانیکونو دوامداره څارنې او تفسیر ته هم اړتیا لري.
  • یو شمیر فکتورونه شتون لري چې په دوامداره توګه د غوښتنلیک فعالیت اغیزه کوي. د مثال په توګه ، د پراختیا کونکو څخه نوي ریلیزونه: د اوسنۍ ستونزې بندول ، دوی په ناپوهۍ سره زاړه بیرته راګرځوي یا په بشپړ ډول نوی رامینځته کوي. د وخت په تیریدو سره، د نویو خپرونو شمیر وده کوي، او د تیروتنو تعقیب کولو پروسه باید اتومات شي، په شمول د کاروونکي ټراجیکونو تحلیل کول.

په ټولیز ډول، ساتل یو اغیزمن وسیله ده. مګر د بشپړتیا لپاره هیڅ حد شتون نلري - دا کیدی شي او باید وده ومومي، پراختیا ومومي، او نوي ښه محصولات د هغې پر بنسټ جوړ شي. هرڅومره چې د پروژې ټولنه فعاله وي ، هومره به فورکس شتون ولري ، او د دې کارولو لپاره به نوي په زړه پوري انتخابونه څرګند شي.

د ساتلو وسیلو په اړه نور معلومات:

سرچینه: www.habr.com

Add a comment