کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

کبھی کبھی، کسی مسئلے کو حل کرنے کے لیے، آپ کو اسے صرف ایک مختلف زاویے سے دیکھنے کی ضرورت ہوتی ہے۔ یہاں تک کہ اگر پچھلے 10 سالوں میں اسی طرح کے مسائل کو مختلف اثرات کے ساتھ حل کیا گیا ہے، یہ حقیقت نہیں ہے کہ یہ طریقہ صرف ایک ہے.

گاہک کی منتھلی جیسا موضوع ہے۔ بات ناگزیر ہے، کیونکہ کسی بھی کمپنی کے صارفین کئی وجوہات کی بناء پر اس کی مصنوعات یا خدمات کا استعمال بند کر سکتے ہیں۔ بلاشبہ، ایک کمپنی کے لیے، چرن ایک فطری ہے، لیکن سب سے زیادہ مطلوبہ عمل نہیں ہے، اس لیے ہر کوئی اس کو کم سے کم کرنے کی کوشش کرتا ہے۔ ابھی تک بہتر ہے، صارفین کے کسی خاص زمرے، یا کسی مخصوص صارف کے لیے منتھن کے امکان کی پیشین گوئی کریں، اور انہیں برقرار رکھنے کے لیے کچھ اقدامات تجویز کریں۔

کم از کم درج ذیل وجوہات کی بنا پر، اگر ممکن ہو تو، تجزیہ کرنے اور کلائنٹ کو برقرار رکھنے کی کوشش کرنا ضروری ہے:

  • نئے گاہکوں کو اپنی طرف متوجہ کرنا برقرار رکھنے کے طریقہ کار سے زیادہ مہنگا ہے۔. نئے گاہکوں کو متوجہ کرنے کے لیے، ایک اصول کے طور پر، آپ کو کچھ رقم (اشتہار) خرچ کرنے کی ضرورت ہے، جبکہ موجودہ گاہکوں کو خصوصی شرائط کے ساتھ خصوصی پیشکش کے ساتھ فعال کیا جا سکتا ہے؛
  • گاہکوں کے جانے کی وجوہات کو سمجھنا مصنوعات اور خدمات کو بہتر بنانے کی کلید ہے۔.

منتھن کی پیشن گوئی کرنے کے معیاری طریقے ہیں۔ لیکن AI چیمپئن شپ میں سے ایک میں، ہم نے اس کے لیے Weibull کی تقسیم کو آزمانے کا فیصلہ کیا۔ یہ اکثر زندہ رہنے کے تجزیہ، موسم کی پیشن گوئی، قدرتی آفات کے تجزیہ، صنعتی انجینئرنگ اور اس طرح کے لئے استعمال کیا جاتا ہے. Weibull ڈسٹری بیوشن ایک خصوصی ڈسٹری بیوشن فنکشن ہے جس کا پیرامیٹر دو پیرامیٹرز سے بنایا گیا ہے۔ کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔ и کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔.

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
وکیپیڈیا

عام طور پر، یہ ایک دلچسپ چیز ہے، لیکن اخراج کی پیشن گوئی کے لیے، اور عام طور پر فنٹیک میں، یہ اکثر استعمال نہیں ہوتا ہے۔ کٹ کے نیچے ہم آپ کو بتائیں گے کہ ہم نے (ڈیٹا مائننگ لیبارٹری) نے یہ کیسے کیا، بیک وقت آرٹیفیشل انٹیلی جنس چیمپئن شپ میں "AI in Banks" کیٹیگری میں سونے کا تمغہ جیتا۔

عام طور پر منتھن کے بارے میں

آئیے اس بارے میں تھوڑا سا سمجھتے ہیں کہ گاہک منتھن کیا ہے اور یہ اتنا اہم کیوں ہے۔ کاروبار کے لیے کسٹمر بیس اہم ہے۔ اس اڈے پر نئے گاہک آتے ہیں، مثال کے طور پر، کسی اشتہار سے کسی پروڈکٹ یا سروس کے بارے میں سیکھنے کے بعد، کچھ وقت کے لیے زندہ رہتے ہیں (مصنوعات کو فعال طور پر استعمال کرتے ہیں) اور کچھ عرصے بعد اس کا استعمال بند کر دیتے ہیں۔ اس مدت کو "کسٹمر لائف سائیکل" کہا جاتا ہے - ایک اصطلاح جو ان مراحل کی وضاحت کرتی ہے جن سے ایک صارف اس وقت گزرتا ہے جب وہ کسی پروڈکٹ کے بارے میں سیکھتا ہے، خریداری کا فیصلہ کرتا ہے، ادائیگی کرتا ہے، استعمال کرتا ہے اور ایک وفادار صارف بن جاتا ہے، اور بالآخر مصنوعات کا استعمال بند کر دیتا ہے۔ کسی نہ کسی وجہ سے۔ اس کے مطابق، چرن کلائنٹ کے لائف سائیکل کا آخری مرحلہ ہے، جب کلائنٹ سروسز کا استعمال بند کر دیتا ہے، اور کاروبار کے لیے اس کا مطلب ہے کہ کلائنٹ نے منافع یا کوئی فائدہ لانا ہی چھوڑ دیا ہے۔

ہر بینک کلائنٹ ایک مخصوص شخص ہوتا ہے جو اپنی ضروریات کے لیے ایک یا دوسرے بینک کارڈ کا انتخاب کرتا ہے۔ اگر آپ اکثر سفر کرتے ہیں تو میلوں والا کارڈ کام آئے گا۔ بہت کچھ خریدتا ہے - ہیلو، کیش بیک کارڈ۔ وہ مخصوص اسٹورز میں بہت کچھ خریدتا ہے - اور اس کے لیے پہلے سے ہی ایک خصوصی پارٹنر پلاسٹک موجود ہے۔ یقیناً، بعض اوقات ایک کارڈ کا انتخاب "سب سے سستی سروس" کے معیار کی بنیاد پر کیا جاتا ہے۔ عام طور پر، یہاں کافی متغیرات ہیں۔

اور ایک شخص خود بینک کا انتخاب بھی کرتا ہے - کیا کسی ایسے بینک سے کارڈ منتخب کرنے کا کوئی فائدہ ہے جس کی شاخیں صرف ماسکو اور علاقے میں ہیں، جب آپ خبروسک سے ہیں؟ یہاں تک کہ اگر ایسے بینک کا کارڈ کم از کم 2 گنا زیادہ منافع بخش ہے، تب بھی قریب میں بینک کی شاخوں کی موجودگی ایک اہم معیار ہے۔ جی ہاں، 2019 پہلے ہی آ چکا ہے اور ڈیجیٹل ہمارا سب کچھ ہے، لیکن کچھ بینکوں کے ساتھ بہت سے مسائل کو صرف ایک برانچ میں ہی حل کیا جا سکتا ہے۔ اس کے علاوہ، ایک بار پھر، آبادی کا کچھ حصہ ایک فزیکل بینک پر اسمارٹ فون کی ایپلی کیشن سے کہیں زیادہ بھروسہ کرتا ہے، اس کو بھی مدنظر رکھنے کی ضرورت ہے۔

نتیجے کے طور پر، کسی شخص کے پاس بینک مصنوعات (یا خود بینک) سے انکار کرنے کی بہت سی وجوہات ہو سکتی ہیں۔ میں نے نوکریاں بدل دیں، اور کارڈ کا ٹیرف تنخواہ سے بدل کر "صرف انسانوں کے لیے" ہو گیا، جو کم منافع بخش ہے۔ میں دوسرے شہر چلا گیا جہاں بینک کی شاخیں نہیں ہیں۔ مجھے برانچ میں نااہل آپریٹر کے ساتھ بات چیت پسند نہیں آئی۔ یعنی پروڈکٹ کو استعمال کرنے کے بجائے اکاؤنٹ بند کرنے کی اور بھی زیادہ وجوہات ہو سکتی ہیں۔

اور کلائنٹ نہ صرف اپنے ارادے کا واضح طور پر اظہار کر سکتا ہے - بینک میں آکر بیان لکھیں، لیکن معاہدہ ختم کیے بغیر صرف مصنوعات کا استعمال بند کر دیں۔ اس طرح کے مسائل کو سمجھنے کے لیے مشین لرننگ اور اے آئی کو استعمال کرنے کا فیصلہ کیا گیا۔

مزید برآں، کسی بھی صنعت (ٹیلی کام، انٹرنیٹ فراہم کرنے والے، انشورنس کمپنیاں، عام طور پر، جہاں کہیں بھی گاہک کی بنیاد اور متواتر لین دین ہو) میں گاہک کی منتھنی ہو سکتی ہے۔

ہم نے کیا کیا ہے

سب سے پہلے، ایک واضح حد کو بیان کرنا ضروری تھا - جس وقت سے ہم کلائنٹ کو چھوڑنے پر غور کرنا شروع کرتے ہیں۔ بینک کے نقطہ نظر سے جس نے ہمیں ہمارے کام کے لیے ڈیٹا فراہم کیا، کلائنٹ کی سرگرمی کی حیثیت بائنری تھی - وہ یا تو فعال ہے یا نہیں۔ "سرگرمی" ٹیبل میں ایک ACTIVE_FLAG جھنڈا تھا، جس کی قدر "0" یا "1" (بالترتیب "غیر فعال" اور "فعال") ہو سکتی ہے۔ اور سب کچھ ٹھیک ہو جائے گا، لیکن ایک شخص ایسا ہے کہ وہ اسے کچھ وقت کے لیے فعال طور پر استعمال کر سکتا ہے، اور پھر ایک ماہ کے لیے فعال فہرست سے باہر ہو جاتا ہے - وہ بیمار ہو گیا، چھٹیوں پر کسی دوسرے ملک چلا گیا، یا یہاں تک کہ ٹیسٹ کے لیے گیا۔ دوسرے بینک سے کارڈ۔ یا ہو سکتا ہے کہ طویل عرصے تک غیرفعالیت کے بعد، بینک کی خدمات کو دوبارہ استعمال کرنا شروع کر دیں۔

اس لیے، ہم نے غیرفعالیت کی مدت کو ایک مخصوص مسلسل مدت کہنے کا فیصلہ کیا جس کے دوران اس کے لیے جھنڈا "0" پر سیٹ کیا گیا تھا۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

مختلف طوالت کی غیرفعالیت کے ادوار کے بعد کلائنٹ غیر فعال سے فعال کی طرف بڑھتے ہیں۔ ہمارے پاس تجرباتی قدر کی ڈگری کا حساب لگانے کا موقع ہے "غیر فعالیت کے ادوار کی وشوسنییتا" - یعنی یہ امکان کہ کوئی شخص عارضی غیر فعالیت کے بعد دوبارہ بینک مصنوعات کا استعمال شروع کر دے گا۔

مثال کے طور پر، یہ گراف کئی مہینوں کی غیرفعالیت (ACTIVE_FLAG=1) کے بعد کلائنٹس کی دوبارہ سرگرمی (ACTIVE_FLAG=0) کو دکھاتا ہے۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

یہاں ہم اس ڈیٹا سیٹ کی تھوڑی سی وضاحت کریں گے جس کے ساتھ ہم نے کام کرنا شروع کیا۔ لہذا، بینک نے مندرجہ ذیل جدولوں میں 19 ماہ کے لیے مجموعی معلومات فراہم کی:

  • "سرگرمی" - صارفین کے ماہانہ لین دین (کارڈز کے ذریعے، انٹرنیٹ بینکنگ اور موبائل بینکنگ میں)، بشمول پے رول اور ٹرن اوور کی معلومات۔
  • "کارڈز" - تمام کارڈز کا ڈیٹا جو کلائنٹ کے پاس ہے، ایک تفصیلی ٹیرف شیڈول کے ساتھ۔
  • "معاہدے" - کلائنٹ کے معاہدوں کے بارے میں معلومات (کھلے اور بند دونوں): قرض، ڈپازٹس، وغیرہ، ہر ایک کے پیرامیٹرز کی نشاندہی کرتے ہیں۔
  • "گاہک" - آبادیاتی ڈیٹا (جنس اور عمر) اور رابطے کی معلومات کی دستیابی کا ایک مجموعہ۔

کام کے لیے ہمیں "نقشہ" کے علاوہ تمام میزوں کی ضرورت تھی۔

یہاں ایک اور مشکل تھی - اس ڈیٹا میں بینک نے یہ نہیں بتایا کہ کارڈز پر کس قسم کی سرگرمی ہوئی ہے۔ یعنی، ہم سمجھ سکتے تھے کہ لین دین تھے یا نہیں، لیکن اب ہم ان کی قسم کا تعین نہیں کر سکتے تھے۔ لہذا، یہ واضح نہیں تھا کہ آیا کلائنٹ نقد رقم نکال رہا تھا، تنخواہ وصول کر رہا تھا، یا خریداری پر رقم خرچ کر رہا تھا۔ ہمارے پاس اکاؤنٹ بیلنس کا ڈیٹا بھی نہیں تھا، جو مفید ہوتا۔

نمونہ بذات خود غیر جانبدارانہ تھا - اس حصے میں، 19 مہینوں کے دوران، بینک نے صارفین کو برقرار رکھنے اور اخراج کو کم کرنے کی کوئی کوشش نہیں کی۔

تو، غیرفعالیت کے ادوار کے بارے میں۔

چرن کی تعریف بنانے کے لیے، غیرفعالیت کی مدت کا انتخاب کیا جانا چاہیے۔ وقت کے ایک موڑ پر منتھن کی پیشن گوئی پیدا کرنے کے لیے کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔آپ کے پاس وقفہ کے ساتھ کم از کم 3 ماہ کی کسٹمر ہسٹری ہونی چاہیے۔ کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔. ہماری تاریخ 19 مہینوں تک محدود تھی، اس لیے ہم نے فیصلہ کیا کہ اگر دستیاب ہو تو 6 ماہ کی غیرفعالیت کا وقت لیا جائے۔ اور اعلی معیار کی پیشن گوئی کے لیے کم از کم مدت کے لیے، ہم نے 3 مہینے لیے۔ ہم نے 3 اور 6 ماہ کے اعداد و شمار تجرباتی طور پر کسٹمر کے ڈیٹا کے رویے کے تجزیے کی بنیاد پر لیے۔

ہم نے منتھن کی تعریف اس طرح تیار کی ہے: گاہک کے منتھن کا مہینہ کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔ ACTIVE_FLAG=0 کے ساتھ یہ پہلا مہینہ ہے، جہاں اس مہینے سے ACTIVE_FLAG فیلڈ میں کم از کم چھ لگاتار صفر ہیں، دوسرے لفظوں میں، وہ مہینہ جس سے کلائنٹ 6 ماہ تک غیر فعال تھا۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
کلائنٹس کی تعداد جو چھوڑ گئے۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
باقی کلائنٹس کی تعداد

چرن کا حساب کیسے لگایا جاتا ہے؟

اس طرح کے مقابلوں میں، اور عملی طور پر عام طور پر، باہر کے بہاؤ کی اکثر اس طرح پیش گوئی کی جاتی ہے۔ کلائنٹ مختلف ادوار میں مصنوعات اور خدمات کا استعمال کرتا ہے، اس کے ساتھ تعامل کے اعداد و شمار کو ایک مقررہ لمبائی n کی خصوصیات کے ویکٹر کے طور پر پیش کیا جاتا ہے۔ اکثر اس معلومات میں شامل ہیں:

  • صارف کی خصوصیت والا ڈیٹا (ڈیموگرافک ڈیٹا، مارکیٹنگ سیگمنٹ)۔
  • بینکنگ مصنوعات اور خدمات کے استعمال کی تاریخ (یہ گاہک کی کارروائیاں ہیں جو ہمیشہ ایک مخصوص وقت یا وقفہ کی مدت سے منسلک ہوتی ہیں جس کی ہمیں ضرورت ہوتی ہے)۔
  • بیرونی ڈیٹا، اگر اسے حاصل کرنا ممکن تھا - مثال کے طور پر، سوشل نیٹ ورکس سے جائزے۔

اور اس کے بعد، وہ منتھن کی تعریف اخذ کرتے ہیں، ہر کام کے لیے مختلف۔ پھر وہ ایک مشین لرننگ الگورتھم استعمال کرتے ہیں، جو کلائنٹ کے جانے کے امکان کی پیش گوئی کرتا ہے۔ کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔ عوامل کے ویکٹر پر مبنی کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔. الگورتھم کو تربیت دینے کے لیے، فیصلہ کن درختوں کے جوڑ بنانے کے لیے ایک معروف فریم ورک استعمال کیا جاتا ہے، XGBoost, لائٹ جی بی ایم, کیٹ بوسٹ یا اس میں ترمیم۔

الگورتھم بذات خود برا نہیں ہے، لیکن اس کے کئی سنگین نقصانات ہیں جب بات منتھن کی پیشین گوئی کی جاتی ہے۔

  • اس کے پاس نام نہاد "میموری" نہیں ہے. ماڈل کا ان پٹ فیچرز کی ایک مخصوص تعداد ہے جو موجودہ وقت کے مطابق ہے۔ پیرامیٹرز میں تبدیلیوں کی تاریخ کے بارے میں معلومات کو ذخیرہ کرنے کے لیے، خاص خصوصیات کا حساب لگانا ضروری ہے جو وقت کے ساتھ ساتھ پیرامیٹرز میں ہونے والی تبدیلیوں کو نمایاں کرتی ہیں، مثال کے طور پر، پچھلے 1,2,3، XNUMX، XNUMX مہینوں میں بینک ٹرانزیکشنز کی تعداد یا رقم۔ یہ نقطہ نظر صرف جزوی طور پر عارضی تبدیلیوں کی نوعیت کو ظاہر کر سکتا ہے۔
  • فکسڈ پیشن گوئی افق۔ ماڈل صرف ایک پہلے سے طے شدہ مدت کے لیے گاہک کی آمدورفت کی پیشین گوئی کرنے کے قابل ہے، مثال کے طور پر، ایک ماہ پہلے کی پیشن گوئی۔ اگر مختلف مدت کے لیے پیشن گوئی کی ضرورت ہے، مثال کے طور پر، تین ماہ، تو آپ کو تربیتی سیٹ کو دوبارہ بنانے اور ایک نئے ماڈل کو دوبارہ تربیت دینے کی ضرورت ہے۔

ہمارا نقطہ نظر

ہم نے فوراً فیصلہ کیا کہ ہم معیاری طریقے استعمال نہیں کریں گے۔ ہمارے علاوہ مزید 497 لوگوں نے چیمپئن شپ میں رجسٹریشن کروائی جن میں سے ہر ایک کو اپنے پیچھے کافی تجربہ تھا۔ لہذا ایسے حالات میں معیاری اسکیم کے مطابق کچھ کرنے کی کوشش کرنا اچھا خیال نہیں ہے۔

اور ہم نے بائنری درجہ بندی کے ماڈل کو درپیش مسائل کو حل کرنا شروع کر دیا جس کے ذریعے کسٹمر کرن کے اوقات کی امکانی تقسیم کی پیش گوئی کی گئی۔ اسی طرح کا نقطہ نظر دیکھا جا سکتا ہے یہاں، یہ آپ کو کلاسیکی نقطہ نظر کے مقابلے میں زیادہ لچکدار طریقے سے منتھن کی پیشن گوئی کرنے اور زیادہ پیچیدہ مفروضوں کی جانچ کرنے کی اجازت دیتا ہے۔ اخراج کے وقت کی ماڈلنگ کرنے والے تقسیم کے خاندان کے طور پر، ہم نے تقسیم کا انتخاب کیا۔ ویبل بقا کے تجزیہ میں اس کے وسیع پیمانے پر استعمال کے لیے۔ کلائنٹ کے رویے کو بقا کی ایک قسم کے طور پر دیکھا جا سکتا ہے۔

پیرامیٹرز کے لحاظ سے Weibull امکانی کثافت کی تقسیم کی مثالیں یہ ہیں۔ کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔ и کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔:

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

یہ تین مختلف گاہکوں کا امکانی کثافت کا فنکشن ہے جو وقت کے ساتھ ساتھ منڈلاتا ہے۔ وقت مہینوں میں پیش کیا جاتا ہے۔ دوسرے لفظوں میں، یہ گراف دکھاتا ہے کہ کب ایک کلائنٹ کے اگلے دو مہینوں میں زیادہ تر ممکنہ طور پر منتشر ہونے کا امکان ہے۔ جیسا کہ آپ دیکھ سکتے ہیں، ایک ڈسٹری بیوشن والے کلائنٹ میں Weibull(2, 0.5) اور Weibull والے کلائنٹس کے مقابلے پہلے چھوڑنے کی زیادہ صلاحیت ہوتی ہے۔ (3,1،XNUMX) تقسیم۔

نتیجہ ایک ماڈل ہے جو، ہر کلائنٹ کے لیے، ہر ایک کے لیے
مہینہ ویبل ڈسٹری بیوشن کے پیرامیٹرز کی پیشین گوئی کرتا ہے، جو وقت کے ساتھ اخراج کے امکان کی بہترین عکاسی کرتا ہے۔ مزید تفصیل میں:

  • تربیتی سیٹ پر ہدف کی خصوصیات ایک مخصوص کلائنٹ کے لیے مخصوص مہینے میں منتھن ہونے تک باقی وقت ہے۔
  • اگر کسی گاہک کے لیے کوئی منتھن کی شرح نہیں ہے، تو ہم فرض کرتے ہیں کہ ہمارے پاس موجود تاریخ کے موجودہ مہینے سے آخر تک کے مہینوں کی تعداد سے زیادہ ہے.
  • استعمال شدہ ماڈل: LSTM پرت کے ساتھ بار بار چلنے والا نیورل نیٹ ورک۔
  • نقصان کے فنکشن کے طور پر، ہم Weibull کی تقسیم کے لیے منفی لاگ امکان کا فنکشن استعمال کرتے ہیں۔

یہاں اس طریقہ کار کے فوائد ہیں:

  • امکانی تقسیم، بائنری درجہ بندی کے واضح امکان کے علاوہ، مختلف واقعات کی لچکدار پیشین گوئی کی اجازت دیتی ہے، مثال کے طور پر، آیا کوئی کلائنٹ 3 ماہ کے اندر بینک کی خدمات کا استعمال بند کر دے گا۔ نیز، اگر ضروری ہو تو، اس تقسیم پر مختلف میٹرکس کا اوسط لگایا جا سکتا ہے۔
  • LSTM ریکرنٹ نیورل نیٹ ورک میموری رکھتا ہے اور پوری دستیاب تاریخ کو مؤثر طریقے سے استعمال کرتا ہے۔ جیسے جیسے کہانی پھیلتی یا بہتر ہوتی ہے، درستگی بڑھتی جاتی ہے۔
  • وقت کی مدت کو چھوٹے حصوں میں تقسیم کرتے وقت نقطہ نظر کو آسانی سے پیمانہ کیا جا سکتا ہے (مثال کے طور پر، مہینوں کو ہفتوں میں تقسیم کرتے وقت)۔

لیکن یہ ایک اچھا ماڈل بنانے کے لیے کافی نہیں ہے؛ آپ کو اس کے معیار کا بھی صحیح اندازہ لگانا ہوگا۔

معیار کا اندازہ کیسے لگایا گیا؟

ہم نے لفٹ وکر کو میٹرک کے طور پر منتخب کیا۔ یہ اس طرح کے معاملات میں کاروبار میں استعمال ہوتا ہے کیونکہ اس کی واضح تشریح ہے، یہ اچھی طرح سے بیان کی گئی ہے۔ یہاں и یہاں. اگر آپ اس میٹرک کے معنی کو ایک جملے میں بیان کرتے ہیں، تو یہ ہوگا "الگورتھم پہلی بار میں کتنی بار بہترین پیشین گوئی کرتا ہے کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔% بے ترتیب سے۔"

ٹریننگ ماڈلز

مسابقت کے حالات نے کوئی خاص معیار کا میٹرک قائم نہیں کیا جس کے ذریعے مختلف ماڈلز اور طریقوں کا موازنہ کیا جا سکے۔ مزید برآں، چرن کی تعریف مختلف ہو سکتی ہے اور اس کا انحصار مسئلہ کے بیان پر ہو سکتا ہے، جس کا تعین کاروباری اہداف سے ہوتا ہے۔ لہذا، یہ سمجھنے کے لیے کہ کون سا طریقہ بہتر ہے، ہم نے دو ماڈلز کو تربیت دی:

  1. ایک عام طور پر استعمال شدہ بائنری درجہ بندی کا نقطہ نظر جو ایک جوڑا فیصلہ ٹری مشین لرننگ الگورتھم (لائٹ جی بی ایم);
  2. Weibull-LSTM ماڈل

ٹیسٹ سیٹ 500 پہلے سے منتخب کلائنٹس پر مشتمل تھا جو ٹریننگ سیٹ میں نہیں تھے۔ کراس توثیق کا استعمال کرتے ہوئے ماڈل کے لیے ہائپر پیرامیٹرز کا انتخاب کیا گیا، جو کلائنٹ کے ذریعے ٹوٹ گیا۔ خصوصیات کے ایک ہی سیٹ کو ہر ماڈل کو تربیت دینے کے لیے استعمال کیا گیا تھا۔

اس حقیقت کی وجہ سے کہ ماڈل میں میموری نہیں ہے، اس کے لیے خصوصی فیچرز لیے گئے تھے، جس میں ایک ماہ کے لیے پیرامیٹرز میں تبدیلیوں کا تناسب پچھلے تین مہینوں میں پیرامیٹرز کی اوسط قدر سے ظاہر ہوتا ہے۔ تین مہینوں کی آخری مدت میں اقدار میں تبدیلی کی شرح کو کس چیز نے نمایاں کیا۔ اس کے بغیر، رینڈم فارسٹ پر مبنی ماڈل Weibull-LSTM کے مقابلے میں نقصان میں ہوگا۔

Weibull کی تقسیم کے ساتھ LSTM کیوں ایک جوڑ کے فیصلے کے درخت کے نقطہ نظر سے بہتر ہے۔

یہاں صرف ایک دو تصویروں میں سب کچھ واضح ہے۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
کلاسیکی الگورتھم اور Weibull-LSTM کے لیے Lift Curve کا موازنہ

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
کلاسیکل الگورتھم اور Weibull-LSTM کے لیے ماہانہ لفٹ کریو میٹرک کا موازنہ

عام طور پر، LSTM تقریباً تمام معاملات میں کلاسیکی الگورتھم سے برتر ہے۔

منحرف پیشن گوئی

Weibull ڈسٹری بیوشن کے ساتھ LSTM سیلز کے ساتھ بار بار چلنے والے نیورل نیٹ ورک پر مبنی ایک ماڈل پہلے سے ہی منتھن کی پیشین گوئی کر سکتا ہے، مثال کے طور پر، اگلے n مہینوں کے اندر گاہک کے منتھن کی پیشین گوئی کر سکتا ہے۔ n = 3 کے معاملے پر غور کریں۔ اس صورت میں، ہر مہینے کے لیے، نیورل نیٹ ورک کو درست طریقے سے یہ طے کرنا چاہیے کہ آیا کلائنٹ اگلے مہینے سے شروع ہو کر اور نویں مہینے تک چلے گا۔ دوسرے الفاظ میں، اسے صحیح طریقے سے تعین کرنا چاہیے کہ آیا گاہک n ماہ کے بعد بھی باقی رہے گا۔ اسے پیشگی پیشن گوئی سمجھا جا سکتا ہے: اس لمحے کی پیشین گوئی جب کلائنٹ چھوڑنے کے بارے میں سوچنا شروع کر رہا تھا۔

آئیے Weibull-LSTM 1، 2 اور 3 ماہ کے اخراج سے پہلے کے لیے Lift Curve کا موازنہ کریں:

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

ہم پہلے ہی اوپر لکھ چکے ہیں کہ ان کلائنٹس کے لیے کی گئی پیشن گوئیاں بھی اہم ہیں جو کچھ عرصے سے فعال نہیں ہیں۔ اس لیے، یہاں ہم نمونے میں ایسے کیسز کو شامل کریں گے جب روانہ ہونے والا گاہک پہلے ہی ایک یا دو ماہ سے غیر فعال ہو، اور چیک کریں کہ Weibull-LSTM ایسے کیسز کو churn کے طور پر درست طریقے سے درجہ بندی کرتا ہے۔ چونکہ اس طرح کے معاملات نمونے میں موجود تھے، ہم توقع کرتے ہیں کہ نیٹ ورک ان کو اچھی طرح سنبھالے گا:

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

کسٹمر برقرار رکھنے

درحقیقت، یہ وہ اہم کام ہے جو کیا جا سکتا ہے، ہاتھ میں معلومات رکھتے ہوئے کہ فلاں فلاں کلائنٹ پروڈکٹ کا استعمال بند کرنے کی تیاری کر رہے ہیں۔ ایک ایسے ماڈل کی تعمیر کے بارے میں بات کرتے ہوئے جو صارفین کو ان کو برقرار رکھنے کے لیے کچھ مفید پیش کر سکے، ایسا نہیں کیا جا سکتا اگر آپ کے پاس ایسی ہی کوششوں کی تاریخ نہیں ہے جو اچھی طرح ختم ہو جائے۔

ہمارے پاس ایسی کوئی کہانی نہیں تھی، اس لیے ہم نے اس طرح فیصلہ کیا۔

  1. ہم ایک ایسا ماڈل بنا رہے ہیں جو ہر کلائنٹ کے لیے دلچسپ مصنوعات کی نشاندہی کرتا ہے۔
  2. ہر ماہ ہم درجہ بندی چلاتے ہیں اور ممکنہ طور پر چھوڑنے والے صارفین کی شناخت کرتے ہیں۔
  3. ہم پوائنٹ 1 کے ماڈل کے مطابق کچھ کلائنٹس کو پروڈکٹ پیش کرتے ہیں اور اپنے اعمال کو یاد رکھتے ہیں۔
  4. چند مہینوں کے بعد، ہم دیکھتے ہیں کہ ان میں سے کون سا ممکنہ طور پر چھوڑنے والے کلائنٹس کو چھوڑ دیا گیا اور کون سا باقی رہا۔ اس طرح، ہم ایک تربیتی نمونہ بناتے ہیں.
  5. ہم مرحلہ 4 میں حاصل کردہ تاریخ کا استعمال کرتے ہوئے ماڈل کو تربیت دیتے ہیں۔
  6. اختیاری طور پر، ہم طریقہ کار کو دہراتے ہیں، مرحلہ 1 سے ماڈل کو مرحلہ 5 میں حاصل کردہ ماڈل سے بدل دیتے ہیں۔

اس طرح کے برقرار رکھنے کے معیار کا ٹیسٹ باقاعدہ A/B ٹیسٹنگ کے ذریعے کیا جا سکتا ہے - ہم ممکنہ طور پر چھوڑنے والے صارفین کو دو گروپوں میں تقسیم کرتے ہیں۔ ہم اپنے برقرار رکھنے کے ماڈل کی بنیاد پر ایک کو مصنوعات پیش کرتے ہیں، اور دوسرے کو ہم کچھ بھی پیش نہیں کرتے ہیں۔ ہم نے ایک ایسے ماڈل کو تربیت دینے کا فیصلہ کیا جو ہماری مثال کے پوائنٹ 1 پر پہلے سے ہی کارآمد ہو سکتا ہے۔

ہم سیگمنٹیشن کو ہر ممکن حد تک قابل تشریح بنانا چاہتے تھے۔ ایسا کرنے کے لیے، ہم نے کئی خصوصیات کا انتخاب کیا جن کی آسانی سے تشریح کی جا سکتی ہے: لین دین کی کل تعداد، اجرت، اکاؤنٹ کا کل کاروبار، عمر، جنس۔ "نقشہ" ٹیبل کی خصوصیات کو غیر معلوماتی کے طور پر نہیں لیا گیا، اور جدول 3 "معاہدے" کی خصوصیات کو پروسیسنگ کی پیچیدگی کی وجہ سے مدنظر نہیں رکھا گیا تاکہ تصدیقی سیٹ اور ٹریننگ سیٹ کے درمیان ڈیٹا کے رساو سے بچا جا سکے۔

کلسٹرنگ گاوسی مکسچر ماڈلز کا استعمال کرتے ہوئے کی گئی تھی۔ Akaike معلومات کے معیار نے ہمیں 2 optima کا تعین کرنے کی اجازت دی۔ پہلا بہترین 1 کلسٹر کے مساوی ہے۔ دوسرا بہترین، کم واضح، 80 کلسٹرز کے مساوی ہے۔ اس نتیجے کی بنیاد پر، ہم مندرجہ ذیل نتیجہ اخذ کر سکتے ہیں: پہلے دی گئی معلومات کے بغیر ڈیٹا کو کلسٹرز میں تقسیم کرنا انتہائی مشکل ہے۔ بہتر کلسٹرنگ کے لیے، آپ کو ڈیٹا کی ضرورت ہے جو ہر کلائنٹ کو تفصیل سے بیان کرے۔

لہذا، زیر نگرانی سیکھنے کے مسئلے پر غور کیا گیا تاکہ ہر ایک کلائنٹ کو ایک مختلف پروڈکٹ پیش کیا جا سکے۔ درج ذیل مصنوعات پر غور کیا گیا: "ٹرم ڈپازٹ"، "کریڈٹ کارڈ"، "اوور ڈرافٹ"، "کنزیومر لون"، "کار لون"، "مارگیج"۔

ڈیٹا میں پروڈکٹ کی ایک اور قسم شامل تھی: "کرنٹ اکاؤنٹ"۔ لیکن ہم نے کم معلوماتی مواد کی وجہ سے اس پر غور نہیں کیا۔ ان صارفین کے لیے جو بینک کلائنٹ ہیں، یعنی اس کی مصنوعات کا استعمال بند نہیں کیا، ایک ماڈل بنایا گیا تھا تاکہ یہ اندازہ لگایا جا سکے کہ کون سی مصنوعات ان کے لیے دلچسپی کا باعث ہو سکتی ہے۔ لاجسٹک ریگریشن کو ماڈل کے طور پر منتخب کیا گیا تھا، اور پہلے 10 پرسنٹائلز کے لیے لفٹ ویلیو کو کوالٹی اسسمنٹ میٹرک کے طور پر استعمال کیا گیا تھا۔

ماڈل کے معیار کا اندازہ تصویر میں لگایا جا سکتا ہے۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔
گاہکوں کے لیے مصنوعات کی سفارش کے ماڈل کے نتائج

کل

اس نقطہ نظر نے ہمیں RAIF-Challenge 2017 AI چیمپئن شپ میں "AI in Banks" کے زمرے میں پہلا مقام دلایا۔

کس طرح ہم نے قدرتی آفت کی طرح اس کے قریب پہنچ کر منتھن کی پیش گوئی کی۔

بظاہر، اصل چیز غیر روایتی زاویے سے مسئلے تک پہنچنا اور ایک ایسا طریقہ استعمال کرنا تھا جو عام طور پر دوسرے حالات کے لیے استعمال ہوتا ہے۔

اگرچہ صارفین کا بڑے پیمانے پر اخراج خدمات کے لیے قدرتی آفت ہو سکتا ہے۔

اس طریقہ کار کو کسی دوسرے شعبے کے لیے بھی مدنظر رکھا جا سکتا ہے جہاں صرف بینکوں کو نہیں بلکہ اخراج کو بھی مدنظر رکھنا ضروری ہے۔ مثال کے طور پر، ہم نے اسے اپنے اپنے اخراج کا حساب لگانے کے لیے استعمال کیا - Rostelecom کی سائبیرین اور سینٹ پیٹرزبرگ شاخوں میں۔

"ڈیٹا مائننگ لیبارٹری" کمپنی "سرچ پورٹل "Sputnik"

ماخذ: www.habr.com

نیا تبصرہ شامل کریں