برقرار رکھنا: ہم نے Python اور Pandas میں مصنوعات کے تجزیات کے لیے اوپن سورس ٹولز کیسے لکھے۔

ہیلو، حبر۔ یہ مضمون کسی ایپلیکیشن یا ویب سائٹ میں صارف کی نقل و حرکت کی رفتار کو پروسیس کرنے کے طریقوں اور ٹولز کے سیٹ کی ترقی کے چار سالوں کے نتائج کے لیے وقف ہے۔ ترقی کے مصنف - میکسم گوڈزی، جو پروڈکٹ تخلیق کاروں کی ٹیم کا سربراہ ہے اور مضمون کا مصنف بھی ہے۔ پروڈکٹ کو ہی Retentioneering کہا جاتا تھا؛ اسے اب اوپن سورس لائبریری میں تبدیل کر دیا گیا ہے اور Github پر پوسٹ کر دیا گیا ہے تاکہ کوئی بھی اسے استعمال کر سکے۔ یہ سب کچھ ان لوگوں کے لیے دلچسپی کا باعث ہو سکتا ہے جو پروڈکٹ اور مارکیٹنگ کے تجزیہ، پروموشن اور پروڈکٹ کی ترقی میں شامل ہیں۔ ویسے، Habré پر Retentioneering کے ساتھ کام کرنے کے معاملات میں سے ایک کے بارے میں ایک مضمون پہلے ہی شائع ہو چکا ہے۔. نیا مواد بتاتا ہے کہ پروڈکٹ کیا کر سکتی ہے اور اسے کیسے استعمال کیا جا سکتا ہے۔

مضمون کو پڑھنے کے بعد، آپ خود اپنا اپنا Retentioneering لکھنے کے قابل ہو جائیں گے؛ یہ ایپلیکیشن میں اور اس سے آگے صارف کی رفتار کو پروسیس کرنے کے لیے کوئی بھی معیاری طریقہ ہو سکتا ہے، جس سے آپ رویے کی خصوصیات کو تفصیل سے دیکھ سکیں گے اور ترقی کے لیے اس سے بصیرت حاصل کر سکیں گے۔ کاروباری پیمائش کے

Retentioneering کیا ہے اور اس کی ضرورت کیوں ہے؟

ہمارا ابتدائی مقصد گروتھ ہیکنگ کو "ڈیجیٹل جادو ٹونے" کی دنیا سے اعداد، تجزیات اور پیشین گوئیوں کی دنیا میں منتقل کرنا تھا۔ نتیجے کے طور پر، مصنوعات کے تجزیات کو خالص ریاضی اور پروگرامنگ تک محدود کر دیا گیا ہے جو ان لوگوں کے لیے جو لاجواب کہانیوں کے بجائے نمبروں کو ترجیح دیتے ہیں، اور "ری برانڈنگ"، "ریپوزیشننگ" وغیرہ جیسے بز ورڈز کے فارمولے، جو اچھے لگتے ہیں، لیکن عملی طور پر بہت کم مدد کرتے ہیں۔

ان مسائل کو حل کرنے کے لیے، ہمیں گرافس اور ٹریکجٹریز کے ذریعے تجزیات کے لیے ایک فریم ورک کی ضرورت تھی، اور ساتھ ہی ایک لائبریری کی ضرورت تھی جو عام تجزیہ کار کے معمولات کو آسان بناتی ہو، جس کے لیے باقاعدہ مصنوعات کے تجزیاتی کاموں کو بیان کیا جا سکے جو لوگوں اور روبوٹ دونوں کے لیے قابل فہم ہوں۔ لائبریری صارف کے رویے کو بیان کرنے اور اسے پروڈکٹ بزنس میٹرکس سے ایسی رسمی اور واضح زبان میں منسلک کرنے کی صلاحیت فراہم کرتی ہے کہ یہ ڈویلپرز اور تجزیہ کاروں کے معمول کے کاموں کو آسان اور خودکار بناتی ہے، اور کاروبار کے ساتھ ان کے رابطے میں سہولت فراہم کرتی ہے۔

Retentioneering ایک طریقہ اور تجزیاتی سافٹ ویئر ٹولز ہے جسے کسی بھی ڈیجیٹل (اور نہ صرف) پروڈکٹ میں ڈھال اور مربوط کیا جا سکتا ہے۔

ہم نے 2015 میں پروڈکٹ پر کام شروع کیا۔ اب یہ ایک ریڈی میڈ ہے، اگرچہ ابھی تک مثالی نہیں ہے، ڈیٹا کے ساتھ کام کرنے کے لیے Python اور Pandas میں ٹولز کا سیٹ، sklearn-like api کے ساتھ مشین لرننگ ماڈل، مشین لرننگ ماڈل eli5 اور shap کے نتائج کی تشریح کے لیے ٹولز۔

یہ سب لپیٹ دیا گیا ہے۔ کھلے گیتھب ریپوزٹری میں ایک آسان اوپن سورس لائبریری تک - برقرار رکھنے والے ٹولز. لائبریری کا استعمال مشکل نہیں ہے؛ تقریباً کوئی بھی شخص جو پروڈکٹ کے تجزیات سے محبت کرتا ہے، لیکن اس نے پہلے کوڈ نہیں لکھا ہے، وہ ہمارے تجزیات کے طریقوں کو اپنے ڈیٹا پر آزادانہ طور پر اور وقتی سرمایہ کاری کے بغیر لاگو کر سکتا ہے۔

ٹھیک ہے، ایک پروگرامر، ایک ایپلیکیشن بنانے والا، یا کسی ڈیولپمنٹ یا ٹیسٹنگ ٹیم کا ممبر جس نے پہلے کبھی تجزیات نہیں کیے ہیں وہ اس کوڈ کے ساتھ کھیلنا شروع کر سکتے ہیں اور باہر کی مدد کے بغیر اپنی ایپلیکیشن کے استعمال کے نمونے دیکھ سکتے ہیں۔

اس کی پروسیسنگ کے لیے تجزیہ اور طریقوں کے بنیادی عنصر کے طور پر صارف کی رفتار

صارف کی رفتار مخصوص وقت کے مقامات پر صارف کی ریاستوں کا ایک سلسلہ ہے۔ مزید برآں، واقعات آن لائن اور آف لائن دونوں ڈیٹا کے مختلف ذرائع سے آ سکتے ہیں۔ صارف کے ساتھ پیش آنے والے واقعات اس کی رفتار کا حصہ ہیں۔ مثالیں:
• بٹن دبایا
• تصویر دیکھی۔
• اسکرین کو ماریں۔
• ایک ای میل موصول ہوا۔
• ایک دوست کو مصنوعات کی سفارش کی
• فارم کو پُر کیا۔
• اسکرین کو تھپتھپایا
• سکرول کیا گیا۔
• کیش رجسٹر میں گیا۔
• ایک burrito کا حکم دیا
• ایک burrito کھایا
• بوریٹو کھانے سے زہر ملا
• پچھلے دروازے سے کیفے میں داخل ہوا۔
• سامنے کے دروازے سے داخل ہوا۔
• درخواست کو کم سے کم کیا گیا۔
• ایک پش اطلاع موصول ہوئی۔
• اسکرین پر X سے زیادہ دیر تک پھنس گیا تھا۔
• آرڈر کے لیے ادائیگی کی گئی۔
• آرڈر خریدا۔
• قرض دینے سے انکار کر دیا گیا تھا۔

اگر آپ صارفین کے ایک گروپ کا ٹریککٹری ڈیٹا لیتے ہیں اور اس بات کا مطالعہ کرتے ہیں کہ ٹرانزیشنز کی ساخت کیسے بنتی ہے، تو آپ بالکل پتہ لگاسکتے ہیں کہ ایپلی کیشن میں ان کے رویے کی ساخت کیسے ہے۔ یہ ایک گراف کے ذریعہ کرنا آسان ہے جس میں ریاستیں نوڈس ہیں، اور ریاستوں کے درمیان ٹرانزیشن کنارے ہیں:

برقرار رکھنا: ہم نے Python اور Pandas میں مصنوعات کے تجزیات کے لیے اوپن سورس ٹولز کیسے لکھے۔

"ٹریجیکٹری" ایک بہت ہی آسان تصور ہے - اس میں صارف کے تمام اعمال کے بارے میں تفصیلی معلومات شامل ہیں، ان اعمال کی تفصیل میں کوئی اضافی ڈیٹا شامل کرنے کی صلاحیت کے ساتھ۔ یہ اسے ایک عالمگیر شے بنا دیتا ہے۔ اگر آپ کے پاس خوبصورت اور آسان ٹولز ہیں جو آپ کو رفتار کے ساتھ کام کرنے کی اجازت دیتے ہیں، تو آپ مماثلتیں تلاش کر سکتے ہیں اور انہیں تقسیم کر سکتے ہیں۔

ٹریکٹری سیگمنٹیشن پہلے تو بہت پیچیدہ معلوم ہو سکتی ہے۔ ایک عام صورت حال میں، یہ معاملہ ہے - آپ کو کنیکٹیویٹی میٹرکس موازنہ یا ترتیب سیدھ استعمال کرنے کی ضرورت ہے۔ ہم ایک آسان طریقہ تلاش کرنے میں کامیاب ہو گئے - بڑی تعداد میں رفتار کا مطالعہ کرنا اور انہیں کلسٹرنگ کے ذریعے تقسیم کرنا۔

جیسا کہ یہ نکلا، مسلسل نمائندگی کا استعمال کرتے ہوئے ایک رفتار کو ایک نقطہ میں تبدیل کرنا ممکن ہے، مثال کے طور پر، TF-IDF. تبدیلی کے بعد، رفتار خلا میں ایک نقطہ بن جاتی ہے جہاں مختلف واقعات اور ان کے درمیان منتقلی کے معمول کے مطابق وقوع پذیر ہونے کو محور کے ساتھ ساتھ ترتیب دیا جاتا ہے۔ ایک بڑی ہزار یا اس سے زیادہ جہتی جگہ سے اس چیز کو (dimS=sum(event type)+sum(ngrams_2types)) کا استعمال کرتے ہوئے ہوائی جہاز پر پیش کیا جاسکتا ہے۔ ٹی ایس این ای. TSNE ایک تبدیلی ہے جو خلا کے طول و عرض کو 2 محور تک کم کر دیتی ہے اور اگر ممکن ہو تو پوائنٹس کے درمیان فاصلوں کو محفوظ رکھتی ہے۔ اس کے مطابق، یہ ایک فلیٹ نقشہ پر ممکن ہو جاتا ہے، رفتار کا ایک علامتی پروجیکشن نقشہ، اس بات کا مطالعہ کرنا کہ مختلف رفتار کے پوائنٹس آپس میں کیسے واقع تھے۔ یہ تجزیہ کرتا ہے کہ وہ ایک دوسرے سے کتنے قریب یا مختلف تھے، چاہے انہوں نے کلسٹر بنائے ہوں یا نقشے میں بکھرے ہوئے ہوں، وغیرہ:

برقرار رکھنا: ہم نے Python اور Pandas میں مصنوعات کے تجزیات کے لیے اوپن سورس ٹولز کیسے لکھے۔

برقرار رکھنے والے تجزیاتی ٹولز پیچیدہ ڈیٹا اور رفتار کو ایک ایسے نقطہ نظر میں تبدیل کرنے کی صلاحیت فراہم کرتے ہیں جس کا ایک دوسرے سے موازنہ کیا جا سکتا ہے، اور پھر تبدیلی کے نتیجے کی جانچ اور تشریح کی جا سکتی ہے۔

ٹریجیکٹریوں پر کارروائی کرنے کے معیاری طریقوں کے بارے میں بات کرتے ہوئے، ہمارا مطلب تین اہم ٹولز ہیں جنہیں ہم نے برقرار رکھنے میں لاگو کیا ہے - گرافس، سٹیپ میٹرکس اور ٹریجیکٹری پروجیکشن میپس۔

Google Analytics، Firebase اور اسی طرح کے تجزیاتی نظاموں کے ساتھ کام کرنا کافی پیچیدہ ہے اور 100% مؤثر نہیں ہے۔ مسئلہ صارف کے لیے متعدد پابندیوں کا ہے، جس کے نتیجے میں ایسے سسٹمز میں تجزیہ کار کا کام ماؤس کے کلکس اور سلائسز کے انتخاب پر منحصر ہوتا ہے۔ برقرار رکھنے سے صارف کی رفتار کے ساتھ کام کرنا ممکن ہو جاتا ہے، نہ کہ صرف فنلز کے ساتھ، جیسا کہ Google Analytics میں، جہاں تفصیل کی سطح کو اکثر ایک فنل تک کم کر دیا جاتا ہے، حالانکہ ایک مخصوص طبقہ کے لیے بنایا گیا ہے۔

برقرار رکھنے اور مقدمات

ترقی یافتہ ٹول کو استعمال کرنے کی ایک مثال کے طور پر، ہم روس میں ایک بڑی طاق سروس کے معاملے کا حوالہ دے سکتے ہیں۔ اس کمپنی کے پاس ایک اینڈرائیڈ موبائل ایپلی کیشن ہے جو صارفین میں مقبول ہے۔ موبائل ایپلیکیشن سے سالانہ ٹرن اوور تقریباً 7 ملین روبل تھا، موسمی اتار چڑھاو 60-130 ہزار کے درمیان تھا۔ اسی کمپنی کے پاس iOS کے لیے بھی ایک ایپلی کیشن ہے، اور ایپل ایپلی کیشن استعمال کرنے والے کا اوسط بل اس کے اوسط بل سے زیادہ تھا۔ اینڈرائیڈ ایپلیکیشن استعمال کرنے والا کلائنٹ - 1080 رگ۔ بمقابلہ 1300 رگڑ۔

کمپنی نے اینڈرائیڈ ایپلی کیشن کی کارکردگی کو بڑھانے کا فیصلہ کیا، جس کے لیے اس نے مکمل تجزیہ کیا۔ درخواست کی تاثیر کو بڑھانے کے بارے میں کئی درجن مفروضے تیار کیے گئے تھے۔ Retentionneering استعمال کرنے کے بعد پتہ چلا کہ مسئلہ ان پیغامات میں تھا جو نئے صارفین کو دکھائے گئے تھے۔ انہوں نے برانڈ، کمپنی کے فوائد اور قیمتوں کے بارے میں معلومات حاصل کیں۔ لیکن، جیسا کہ یہ نکلا، پیغامات صارف کو ایپلی کیشن میں کام کرنے کا طریقہ سیکھنے میں مدد کرنے والے تھے۔

برقرار رکھنا: ہم نے Python اور Pandas میں مصنوعات کے تجزیات کے لیے اوپن سورس ٹولز کیسے لکھے۔

ایسا کیا گیا، جس کے نتیجے میں ایپلیکیشن کم ان انسٹال ہو گئی، اور آرڈر میں تبدیلی میں 23% اضافہ ہوا۔ سب سے پہلے، آنے والی ٹریفک کا 20 فیصد ٹیسٹ کو دیا گیا تھا، لیکن کچھ دنوں کے بعد، پہلے نتائج کا تجزیہ کرنے اور رجحان کا اندازہ لگانے کے بعد، انہوں نے تناسب کو تبدیل کر دیا اور، اس کے برعکس، 20 فیصد کنٹرول گروپ کے لیے چھوڑ دیا، اور اسی فیصد ٹیسٹ میں رکھا گیا تھا. ایک ہفتہ بعد، یہ فیصلہ کیا گیا کہ ترتیب وار دو مزید مفروضوں کی جانچ شامل کی جائے۔ صرف سات ہفتوں میں اینڈرائیڈ ایپلی کیشن سے ٹرن اوور گزشتہ سطح کے مقابلے میں ڈیڑھ گنا بڑھ گیا۔

Retentioneering کے ساتھ کیسے کام کیا جائے؟

پہلے اقدامات کافی آسان ہیں - لائبریری کو pip install retentioneering کمانڈ کے ساتھ ڈاؤن لوڈ کریں۔ ریپوزٹری میں ہی کچھ مصنوعات کے تجزیاتی کاموں کے لیے تیار شدہ مثالیں اور ڈیٹا پروسیسنگ کے کیسز شامل ہیں۔ سیٹ کو مسلسل اپ ڈیٹ کیا جاتا ہے جب تک کہ یہ پہلے جاننے والے کے لیے کافی نہ ہو۔ کوئی بھی تیار شدہ ماڈیول لے سکتا ہے اور انہیں فوری طور پر اپنے کاموں پر لاگو کر سکتا ہے - اس سے وہ فوری طور پر زیادہ تفصیلی تجزیہ اور صارف کی رفتار کو بہتر بنانے کے عمل کو جلد سے جلد اور مؤثر طریقے سے ترتیب دے سکتا ہے۔ یہ سب واضح کوڈ کے ذریعے ایپلیکیشن کے استعمال کے نمونوں کو تلاش کرنا اور اس تجربے کو ساتھیوں کے ساتھ شیئر کرنا ممکن بناتا ہے۔

Retentioneering آپ کی درخواست کی پوری زندگی میں استعمال کرنے کے قابل ایک ٹول ہے، اور اس کی وجہ یہ ہے:

  • برقرار رکھنا صارف کی رفتار کو ٹریک کرنے اور مسلسل بہتر بنانے اور کاروباری کارکردگی کو بہتر بنانے کے لیے موثر ہے۔ اس طرح، ای کامرس ایپلی کیشنز میں اکثر نئی خصوصیات شامل کی جاتی ہیں، جن کے مصنوعات پر اثرات کا ہمیشہ صحیح اندازہ نہیں لگایا جا سکتا۔ بعض صورتوں میں، نئے اور پرانے فنکشنز کے درمیان مطابقت کے مسائل پیدا ہوتے ہیں - مثال کے طور پر، نئے موجودہ فنکشنز کو "آدمی بنانا"۔ اور اس صورت حال میں، رفتار کا مسلسل تجزیہ بالکل وہی ہے جس کی ضرورت ہے۔
  • ایڈورٹائزنگ چینلز کے ساتھ کام کرتے وقت بھی صورتحال ایسی ہی ہے: ٹریفک کے نئے ذرائع اور اشتہاری تخلیقات کو مسلسل جانچا جا رہا ہے، موسمی، رجحانات اور دیگر واقعات کے اثر و رسوخ کی نگرانی کرنا ضروری ہے، جس کی وجہ سے مسائل کے زیادہ سے زیادہ نئے طبقے ابھرتے ہیں۔ اس کے لیے صارف میکانکس کی مسلسل نگرانی اور تشریح کی بھی ضرورت ہے۔
  • بہت سے عوامل ہیں جو درخواست کی کارکردگی کو مسلسل متاثر کرتے ہیں۔ مثال کے طور پر، ڈویلپرز کی جانب سے نئی ریلیز: موجودہ مسئلے کو بند کرتے ہوئے، وہ نادانستہ طور پر پرانا واپس کر دیتے ہیں یا بالکل نیا بنا دیتے ہیں۔ وقت گزرنے کے ساتھ، نئی ریلیز کی تعداد بڑھتی جاتی ہے، اور غلطیوں کا سراغ لگانے کے عمل کو خودکار ہونے کی ضرورت ہوتی ہے، بشمول صارف کی رفتار کا تجزیہ کرنا۔

مجموعی طور پر، برقرار رکھنا ایک مؤثر ذریعہ ہے۔ لیکن کمال کی کوئی حد نہیں ہے - اس کی بنیاد پر اسے بہتر، ترقی یافتہ اور نئی ٹھنڈی مصنوعات بنائی جا سکتی ہیں اور ہونی چاہئیں۔ پروجیکٹ کی کمیونٹی جتنی زیادہ فعال ہوگی، اتنے ہی زیادہ فورک ہوں گے، اور اسے استعمال کرنے کے لیے نئے دلچسپ آپشنز ظاہر ہوں گے۔

برقرار رکھنے والے ٹولز کے بارے میں مزید معلومات:

ماخذ: www.habr.com

نیا تبصرہ شامل کریں