اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

ڪڏهن ڪڏهن، هڪ مسئلي کي حل ڪرڻ لاء، توهان کي صرف ان کي مختلف زاوي کان ڏسڻ جي ضرورت آهي. جيتوڻيڪ گذريل 10 سالن ۾ ساڳيا مسئلا مختلف اثرن سان ساڳي طريقي سان حل ڪيا ويا آهن، اها حقيقت ناهي ته اهو طريقو صرف هڪ آهي.

هتي هڪ اهڙو موضوع آهي جيئن ڪسٽمر چرن. شيء ناگزير آهي، ڇاڪاڻ ته ڪنهن به ڪمپني جا گراهڪ، ڪيترن ئي سببن لاء، پنهنجي پروڊڪٽس يا خدمتن کي استعمال ڪرڻ بند ڪري سگهن ٿا. يقينن، هڪ ڪمپني لاء، چرن هڪ قدرتي آهي، پر سڀ کان وڌيڪ گهربل عمل ناهي، تنهنڪري هرڪو هن چرن کي گهٽائڻ جي ڪوشش ڪري ٿو. اڃا بھتر، استعمال ڪندڙن جي ھڪڙي خاص قسم، يا ھڪڙي مخصوص استعمال ڪندڙ لاءِ چرن جي امڪان جي اڳڪٿي ڪريو، ۽ انھن کي برقرار رکڻ لاءِ ڪجھ قدمن جو مشورو ڏيو.

اهو ضروري آهي ته تجزيو ڪرڻ ۽ ڪلائنٽ کي برقرار رکڻ جي ڪوشش، جيڪڏهن ممڪن هجي، گهٽ ۾ گهٽ هيٺين سببن لاء:

  • نون گراهڪن کي راغب ڪرڻ برقرار رکڻ جي طريقيڪار کان وڌيڪ قيمتي آهي. نون گراهڪن کي راغب ڪرڻ لاء، ضابطي جي طور تي، توهان کي ڪجهه پئسا خرچ ڪرڻ جي ضرورت آهي (اشتهار)، جڏهن ته موجوده گراهڪن کي خاص شرطن سان خاص آڇ سان چالو ڪري سگهجي ٿو؛
  • سمجھڻ جا سبب ڇو گراهڪ ڇڏيندا آهن پروڊڪٽس ۽ خدمتن کي بهتر ڪرڻ جي ڪنجي آهي.

اڳڪٿي ڪرڻ لاءِ معياري طريقا موجود آهن. پر هڪ AI چيمپئن شپ ۾، اسان هن لاء Weibull تقسيم جي ڪوشش ڪرڻ جو فيصلو ڪيو. اهو اڪثر ڪري استعمال ڪيو ويندو آهي بقا جي تجزيي، موسم جي اڳڪٿي، قدرتي آفت جي تجزيي، صنعتي انجنيئرنگ ۽ جهڙوڪ. Weibull distribution is a special distribution function for parameterized by two parameters اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان и اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
وڪيپيڊيا

عام طور تي، اها هڪ دلچسپ شيء آهي، پر اڳڪٿي ڪرڻ جي وهڪري لاء، ۽ عام طور تي fintech ۾، اهو اڪثر استعمال نه ڪيو ويو آهي. ڪٽ جي هيٺان اسين توهان کي ٻڌائينداسين ته اسان (ڊيٽا مائننگ ليبارٽري) اهو ڪيئن ڪيو، گڏو گڏ آرٽيفيشل انٽيليجنس چيمپيئن شپ ۾ ”اي آءِ ان بئنڪس“ ڪيٽيگري ۾ سون کٽيو.

عام طور تي ڇڪڻ بابت

اچو ته ٿورڙو سمجھون ته گراهڪ چرن ڇا آهي ۽ اهو ايترو ضروري ڇو آهي. هڪ ڪسٽمر بنياد هڪ ڪاروبار لاء اهم آهي. نوان گراهڪ هن بنياد تي ايندا آهن، مثال طور، هڪ اشتهار مان هڪ پراڊڪٽ يا خدمت بابت سکيا، ڪجهه وقت لاء رهن ٿا (فعال طور تي مصنوعات استعمال ڪريو) ۽ ڪجهه وقت کان پوء ان کي استعمال ڪرڻ بند ڪريو. هن دور کي ”ڪسٽمر لائف سائيڪل“ چئبو آهي - هڪ اصطلاح جيڪو بيان ڪري ٿو انهن مرحلن مان جنهن مان هڪ گراهڪ گذرندو آهي جڏهن هو ڪنهن پروڊڪٽ جي باري ۾ سکي ٿو، خريداري جو فيصلو ڪري ٿو، ادا ڪري ٿو، استعمال ڪري ٿو ۽ هڪ وفادار صارف بڻجي ٿو، ۽ آخرڪار پراڊڪٽ استعمال ڪرڻ بند ڪري ٿو. هڪ سبب يا ٻئي لاء. ان جي مطابق، گراهڪ ڪلائنٽ جي زندگي جي چڪر جو آخري مرحلو آهي، جڏهن ڪلائنٽ خدمتن کي استعمال ڪرڻ بند ڪري ٿو، ۽ ڪاروبار لاء هن جو مطلب آهي ته ڪلائنٽ منافعو يا ڪو به فائدو حاصل ڪرڻ بند ڪري ڇڏيو آهي.

هر بينڪ ڪلائنٽ هڪ مخصوص شخص آهي جيڪو هڪ يا ٻيو بينڪ ڪارڊ خاص طور تي پنهنجي ضرورتن لاءِ چونڊيندو آهي. جيڪڏهن توهان اڪثر سفر ڪندا آهيو، ميلن سان هڪ ڪارڊ هٿ ۾ ايندو. تمام گهڻو خريد ڪري ٿو - هيلو، ڪيش بيڪ ڪارڊ. هو خاص اسٽورن ۾ تمام گهڻو خريد ڪري ٿو - ۽ هن لاءِ اڳ ۾ ئي هڪ خاص پارٽنر پلاسٽڪ آهي. يقينا، ڪڏهن ڪڏهن هڪ ڪارڊ چونڊيو ويندو آهي "سست ترين خدمت" جي معيار جي بنياد تي. عام طور تي، هتي ڪافي متغير آهن.

۽ ھڪڙو ماڻھو پاڻ کي بينڪ پڻ چونڊيندو آھي - ڇا ھڪڙو بينڪ مان ھڪڙو ڪارڊ چونڊڻ ۾ ڪو نقطو آھي جنھن جون شاخون صرف ماسڪو ۽ علائقي ۾ آھن، جڏھن توھان Khabarovsk کان آھيو؟ جيتوڻيڪ جيڪڏهن اهڙي بئنڪ مان هڪ ڪارڊ گهٽ ۾ گهٽ 2 ڀيرا وڌيڪ منافعو آهي، ويجهي بئنڪ شاخن جي موجودگي اڃا تائين هڪ اهم معيار آهي. ها، 2019 اڳ ۾ ئي هتي آهي ۽ ڊجيٽل اسان جي هر شيء آهي، پر ڪجهه بينڪن سان مسئلا صرف هڪ شاخ ۾ حل ٿي سگهن ٿا. ان سان گڏ، ٻيهر، آبادي جو ڪجهه حصو هڪ اسمارٽ فون تي ايپليڪيشن کان گهڻو ڪجهه جسماني بئنڪ تي ڀروسو ڪري ٿو، اهو پڻ حساب ۾ رکڻ جي ضرورت آهي.

نتيجي طور، هڪ شخص شايد بينڪ جي شين کي رد ڪرڻ جا ڪيترائي سبب هوندا (يا بينڪ پاڻ). مون نوڪريون بدلائي ڇڏيون، ۽ ڪارڊ جو ٽريف تنخواه کان بدلجي ويو ”صرف انسانن لاءِ“، جيڪو گهٽ منافعي وارو آهي. مان ٻئي شهر هليو ويس جتي بئنڪ برانچون نه آهن. مون برانچ ۾ نااهل آپريٽر سان ڳالهه ٻولهه کي پسند نه ڪيو. اهو آهي، اڪائونٽ کي بند ڪرڻ جا اڃا به وڌيڪ سبب هوندا پراڊڪٽ استعمال ڪرڻ کان.

۽ گراهڪ نه رڳو واضح طور تي پنهنجي ارادي جو اظهار ڪري سگهي ٿو - بينڪ ڏانهن اچو ۽ هڪ بيان لکو، پر صرف معاهدي کي ختم ڪرڻ کان سواء پروڊڪٽس کي استعمال ڪرڻ بند ڪريو. اهڙين مسئلن کي سمجهڻ لاءِ مشين لرننگ ۽ AI استعمال ڪرڻ جو فيصلو ڪيو ويو.

ان کان علاوه، گراهڪ چرن ڪنهن به صنعت ۾ ٿي سگھي ٿو (ٽيلي ڪام، انٽرنيٽ فراهم ڪندڙ، انشورنس ڪمپنيون، عام طور تي، جتي ڪٿي به گراهڪ جو بنياد آهي ۽ وقتي ٽرانزيڪشن).

اسان ڇا ڪيو آهي

سڀ کان پهريان، اهو ضروري هو ته هڪ واضح حد بيان ڪرڻ گهرجي - ڪهڙي وقت کان اسان ڪلائنٽ کي ڇڏي ڏيڻ تي غور ڪرڻ شروع ڪيو. بينڪ جي نقطي نظر کان جيڪو اسان کي اسان جي ڪم لاء ڊيٽا مهيا ڪيو، ڪلائنٽ جي سرگرمي جي حيثيت بائنري هئي - هو يا ته فعال آهي يا نه. "سرگرمي" جدول ۾ ھڪڙو ACTIVE_FLAG جھنڊو ھو، جنھن جي قيمت يا ته ٿي سگھي ٿي "0" يا "1" ("غير فعال" ۽ "فعال" ترتيب سان). ۽ سڀ ڪجهه ٺيڪ ٿي ويندو، پر هڪ شخص اهڙو آهي ته هو ان کي فعال طور تي ڪجهه وقت لاء استعمال ڪري سگهي ٿو، ۽ پوء هڪ مهيني لاء فعال فهرست مان ٻاهر نڪري ويو - هو بيمار ٿي ويو، موڪلن تي ڪنهن ٻئي ملڪ ڏانهن ويو، يا اڃا به امتحان لاء ويو. ٻئي بئنڪ کان ڪارڊ. يا ٿي سگهي ٿو هڪ ڊگهي عرصي کان پوءِ غيرفعاليت، بئنڪ جون خدمتون ٻيهر استعمال ڪرڻ شروع ڪريو

تنهن ڪري، اسان غير فعال ٿيڻ جي مدت کي سڏڻ جو فيصلو ڪيو هڪ مخصوص مسلسل عرصي دوران جنهن دوران ان لاء پرچم "0" تي مقرر ڪيو ويو.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

ڪلائنٽ مختلف لمبائي جي غير فعال ٿيڻ واري عرصي کان پوءِ غير فعال کان چالو ٿي ويندا آهن. اسان وٽ اهو موقعو آهي ته تجرباتي قدر جي درجي کي ڳڻڻ جو "غيرفعاليت جي دورن جي اعتبار" - اهو آهي، امڪان اهو آهي ته هڪ شخص عارضي غير فعال ٿيڻ کان پوء ٻيهر بينڪ پروڊڪٽ استعمال ڪرڻ شروع ڪندو.

مثال طور، هي گراف ڪيترن ئي مهينن جي غير فعال ٿيڻ کان پوءِ ڪلائنٽ جي سرگرمي (ACTIVE_FLAG=1) جي بحالي ڏيکاري ٿو (ACTIVE_FLAG=0).

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

هتي اسان ٿورو وضاحت ڪنداسين ڊيٽا سيٽ جنهن سان اسان ڪم ڪرڻ شروع ڪيو. تنهن ڪري، بئنڪ 19 مھينن لاء مجموعي معلومات ھيٺ ڏنل جدولن ۾ مهيا ڪئي:

  • ”سرگرمي“ - مھينو گراهڪ ٽرانزيڪشن (ڪارڊ ذريعي، انٽرنيٽ بئنڪنگ ۽ موبائيل بئنڪنگ ۾)، بشمول پگهار ۽ ٽران اوور تي معلومات.
  • "ڪارڊ" - سڀني ڪارڊن بابت ڊيٽا جيڪي ڪلائنٽ وٽ آهن، تفصيلي ٽريف شيڊول سان.
  • "معاهدو" - ڪلائنٽ جي معاهدي جي باري ۾ معلومات (ٻئي کليل ۽ بند): قرض، جمع، وغيره، هر هڪ جي پيٽرولن کي ظاهر ڪندي.
  • "گراهڪ" - ڊيموگرافڪ ڊيٽا جو هڪ سيٽ (جنس ۽ عمر) ۽ رابطي جي معلومات جي دستيابي.

ڪم لاءِ اسان کي ”نقشي“ کانسواءِ سڀني جدولن جي ضرورت ھئي.

هتي هڪ ٻي ڏکيائي هئي - هن ڊيٽا ۾ بينڪ ظاهر نه ڪيو آهي ته ڪارڊ تي ڪهڙي قسم جي سرگرمي ڪئي وئي آهي. اھو آھي، اسان سمجھي سگھون ٿا ته اتي ٽرانزيڪشن آھن يا نه، پر اسان انھن جي قسم کي وڌيڪ طئي نه ڪري سگھون ٿا. تنهن ڪري، اهو واضح ناهي ته ڪلائنٽ نقد رقم واپس وٺي رهيو هو، تنخواه وصول ڪري رهيو هو، يا خريداري تي پئسا خرچ ڪري رهيو هو. اسان وٽ اڪائونٽ بيلنس تي ڊيٽا پڻ نه هئي، جيڪا مفيد ٿئي ها.

نمونو پاڻ غيرجانبدار هو - هن نموني ۾، 19 مهينن کان وڌيڪ، بينڪ گراهڪ کي برقرار رکڻ ۽ نڪرڻ کي گهٽائڻ جي ڪا به ڪوشش نه ڪئي.

تنهن ڪري، غير فعالي جي دورن بابت.

چرن جي تعريف کي ترتيب ڏيڻ لاء، غير فعالي جي مدت کي چونڊيو وڃي. وقت ۾ هڪ نقطي تي چرن جي اڳڪٿي ٺاهڻ لاء اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان, توهان کي هڪ وقفي تي گهٽ ۾ گهٽ 3 مهينن جي گراهڪ تاريخ هجڻ ضروري آهي اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان. اسان جي تاريخ 19 مھينن تائين محدود ھئي، تنھنڪري اسان 6 مھينن جي غير فعال ٿيڻ جو فيصلو ڪيو، جيڪڏھن موجود ھجي. ۽ گهٽ ۾ گهٽ عرصي لاءِ اعليٰ معيار جي اڳڪٿي لاءِ، اسان 3 مهينا کنيا. اسان 3 ۽ 6 مهينن جا انگ اکر تجرباتي طور تي ڪسٽمر ڊيٽا جي رويي جي تجزيي جي بنياد تي ورتو.

اسان هن ريت ٺهرايو آهي چرن جي تعريف: گراهڪ چرن جو مهينو اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان هي پهريون مهينو آهي ACTIVE_FLAG=0 سان، جتي هن مهيني کان ACTIVE_FLAG فيلڊ ۾ گهٽ ۾ گهٽ ڇهه لڳاتار صفر آهن، ٻين لفظن ۾، اهو مهينو جنهن کان ڪلائنٽ 6 مهينن تائين غير فعال هو.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
گراهڪن جو تعداد جيڪي ڇڏي ويا

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
باقي گراهڪن جو تعداد

ڪچرو ڪيئن حساب ڪيو ويو آهي؟

اهڙين مقابلن ۾، ۽ عملي طور تي، عام طور تي، نڪرندڙ اڪثر هن طريقي سان پيش ڪيو ويندو آهي. ڪلائنٽ مختلف وقتن تي پروڊڪٽس ۽ خدمتون استعمال ڪري ٿو، ان سان رابطي جي ڊيٽا کي هڪ مقرر ٿيل ڊيگهه جي خاصيتن جي ویکٹر طور پيش ڪيو ويو آهي. گهڻو ڪري هن معلومات ۾ شامل آهن:

  • ڊيٽا استعمال ڪندڙ جي خاصيت (ڊيموگرافڪ ڊيٽا، مارڪيٽنگ سيڪشن).
  • بئنڪنگ پراڊڪٽس ۽ خدمتن جي استعمال جي تاريخ (اهي گراهڪ ڪارناما آهن جيڪي هميشه هڪ مخصوص وقت يا وقفي جي مدت سان جڙيل آهن جن کي اسان جي ضرورت آهي).
  • خارجي ڊيٽا، جيڪڏھن ان کي حاصل ڪرڻ ممڪن هو - مثال طور، سماجي نيٽ ورڪن کان تبصرا.

۽ ان کان پوء، اهي هر ڪم لاء مختلف، چرن جي هڪ تعريف حاصل ڪن ٿا. پوءِ اهي هڪ مشين لرننگ الگورتھم استعمال ڪن ٿا، جيڪو اڳڪٿي ڪري ٿو ڪلائنٽ جي وڃڻ جي امڪان اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان فڪٽرن جي ویکٹر جي بنياد تي اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان. الگورتھم کي تربيت ڏيڻ لاء، فيصلي جي وڻن جي ensembles جي تعمير لاء معروف فريم ورڪ مان ھڪڙو استعمال ڪيو ويندو آھي، XGBoost, لائيٽ جي بي ايم, ٻلي يا ان ۾ تبديليون.

الورورٿم بذات خود خراب نه آهي، پر ان ۾ ڪيترائي سنگين نقصان آهن جڏهن اها اڳڪٿي ڪرڻ جي ڳالهه اچي ٿي.

  • هن وٽ نام نهاد ”ياداشت“ ناهي. ماڊل جي ان پٽ خاصيتن جو هڪ مخصوص تعداد آهي جيڪو وقت جي موجوده نقطي سان ملندو آهي. پيٽرولر ۾ تبديلين جي تاريخ جي باري ۾ معلومات کي ذخيرو ڪرڻ لاء، اهو ضروري آهي ته خاص خاصيتن کي ڳڻڻ گهرجي جيڪي وقت سان گڏ پيٽرولن ۾ تبديلين کي بيان ڪن ٿيون، مثال طور، گذريل 1,2,3، XNUMX، XNUMX مهينن دوران بينڪ ٽرانزيڪشن جو تعداد يا رقم. اهو طريقو صرف جزوي طور تي عارضي تبديلين جي فطرت کي ظاهر ڪري سگهي ٿو.
  • مقرر ٿيل اڳڪٿي افق. ماڊل صرف اڳواٽ مقرر وقت لاءِ گراهڪ جي چرن جي اڳڪٿي ڪرڻ جي قابل آهي، مثال طور، اڳڪٿي هڪ مهينو اڳ. جيڪڏهن اڳڪٿي مختلف وقتن لاءِ گهربل هجي، مثال طور، ٽي مهينا، پوءِ توهان کي ٽريننگ سيٽ کي ٻيهر ٺاهڻ ۽ نئين ماڊل کي ٻيهر تربيت ڏيڻ جي ضرورت آهي.

اسان جو طريقو

اسان فوري طور تي فيصلو ڪيو ته اسان معياري طريقا استعمال نه ڪنداسين. اسان کان علاوه، 497 وڌيڪ ماڻهن چيمپئن شپ ۾ رجسٽرڊ ڪيو، جن مان هر هڪ جي پويان ڪافي تجربو هو. تنهنڪري اهڙين حالتن ۾ معياري اسڪيم جي مطابق ڪجهه ڪرڻ جي ڪوشش ڪرڻ سٺو خيال ناهي.

۽ اسان بائنري درجه بندي ماڊل کي درپيش مسئلن کي حل ڪرڻ شروع ڪيو، اڳڪٿي ڪندي گراهڪ جي ورهاست جي امڪاني ورڇ جي. ساڳيو طريقو ڏسي سگهجي ٿو هتي، اهو توهان کي اجازت ڏئي ٿو ته چرن کي وڌيڪ لچڪدار انداز سان پيش ڪرڻ ۽ وڌيڪ پيچيده مفروضن کي جانچڻ جي ڀيٽ ۾ ڪلاسيڪل انداز ۾. تقسيم جي خاندان جي طور تي ٻاهر نڪرڻ واري وقت کي ماڊل ڪندي، اسان تقسيم کي چونڊيو ويبل بقا جي تجزيي ۾ ان جي وسيع استعمال لاء. ڪلائنٽ جي رويي کي هڪ قسم جي بقا جي طور تي ڏسي سگهجي ٿو.

هتي مثال آهن Weibull امڪاني کثافت جي تقسيم جا پيرا ميٽرز جي لحاظ سان اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان и اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان:

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

هي آهي امڪاني کثافت جو ڪم ٽن مختلف گراهڪ جي وقت سان گڏ چرن. وقت مهينن ۾ پيش ڪيو ويندو آهي. ٻين لفظن ۾، هي گراف ڏيکاري ٿو جڏهن هڪ ڪلائنٽ گهڻو ڪري ايندڙ ٻن مهينن ۾ چرڻ جو امڪان آهي. جيئن توهان ڏسي سگهو ٿا، هڪ ڪلائنٽ هڪ تقسيم سان گڏ ڪلائنٽ کان اڳ ڇڏڻ جي وڏي صلاحيت آهي Weibull (2, 0.5) ۽ Weibull سان (3,1،XNUMX) تقسيم.

نتيجو هڪ نمونو آهي، جيڪو هر ڪلائنٽ لاء، هر هڪ لاء
مهينو Weibull تقسيم جي پيرا ميٽرن جي اڳڪٿي ڪري ٿو، جيڪو وقت سان گڏ نڪرڻ جي امڪان جي واقعن کي بهترين طور تي ظاهر ڪري ٿو. وڌيڪ تفصيل ۾:

  • ٽريننگ سيٽ تي ھدف جون خاصيتون مخصوص ڪلائنٽ لاءِ مخصوص مھيني ۾ چرڻ تائين باقي وقت آھن.
  • جيڪڏهن ڪنهن گراهڪ لاءِ ڪو به گراهڪ جي شرح نه آهي، اسان فرض ڪريون ٿا ته ڇنڊڇاڻ جو وقت موجوده مهيني کان وٺي تاريخ جي آخر تائين مهينن جي تعداد کان وڌيڪ آهي.
  • استعمال ٿيل ماڊل: LSTM پرت سان بار بار نيورل نيٽ ورڪ.
  • نقصان جي فنڪشن جي طور تي، اسان استعمال ڪندا آهيون منفي لاگ-امڪان وارو فنڪشن Weibull تقسيم لاءِ.

هتي هن طريقي جا فائدا آهن:

  • امڪاني تقسيم، بائنري درجه بندي جي واضح امڪان کان علاوه، مختلف واقعن جي لچڪدار اڳڪٿي ڪرڻ جي اجازت ڏئي ٿي، مثال طور، ڇا هڪ گراهڪ 3 مهينن اندر بينڪ جي خدمتن کي استعمال ڪرڻ بند ڪري ڇڏيندو. انهي سان گڏ، جيڪڏهن ضروري هجي ته، مختلف ميٽرڪ هن ورڇ تي اوسط ٿي سگهن ٿيون.
  • LSTM بار بار نيورل نيٽ ورڪ کي ميموري آهي ۽ مؤثر طريقي سان پوري دستياب تاريخ استعمال ڪري ٿي. جيئن ڪهاڻي وڌندي يا سڌري ويندي آهي، درستگي وڌي ويندي آهي.
  • طريقه ڪار آساني سان ماپ ڪري سگهجي ٿو جڏهن وقت جي دورن کي ننڍن ۾ ورهايو وڃي (مثال طور، جڏهن مهينن کي هفتن ۾ ورهايو وڃي).

پر اهو هڪ سٺو ماڊل ٺاهڻ لاء ڪافي ناهي؛ توهان کي پڻ ان جي معيار جو صحيح اندازو ڪرڻ جي ضرورت آهي.

معيار کي ڪيئن اندازو لڳايو ويو؟

اسان ميٽرڪ طور لفٽ وکر چونڊيو. اهو ڪاروبار ۾ اهڙين ڪيسن لاء استعمال ڪيو ويندو آهي ڇاڪاڻ ته ان جي واضح تشريح جي ڪري، اهو چڱي طرح بيان ڪيو ويو آهي هتي и هتي. جيڪڏهن توهان هن ميٽرڪ جي معني کي هڪ جملي ۾ بيان ڪريو ٿا، اهو ٿيندو "ڪيترو ڀيرا الورورٿم پهرين ۾ بهترين اڳڪٿي ڪري ٿو. اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان% کان بي ترتيب."

ٽريننگ ماڊلز

مقابلي جي حالتن هڪ مخصوص معيار جي ميٽرڪ قائم نه ڪئي جنهن جي ذريعي مختلف ماڊل ۽ طريقن سان مقابلو ڪري سگهجي ٿو. ان کان علاوه، چرن جي تعريف مختلف ٿي سگهي ٿي ۽ شايد مسئلي جي بيان تي منحصر هجي، جنهن جي نتيجي ۾، ڪاروباري مقصدن طرفان طئي ڪيو ويندو آهي. تنهن ڪري، سمجهڻ لاء ڪهڙو طريقو بهتر آهي، اسان ٻن ماڊل کي تربيت ڏني:

  1. عام طور تي استعمال ٿيل بائنري درجه بندي جو طريقو استعمال ڪندي هڪ ensemble فيصلي واري وڻ جي مشين جي سکيا وارو الگورتھم (لائيٽ جي بي ايم);
  2. Weibull-LSTM ماڊل

ٽيسٽ سيٽ ۾ 500 اڳ-منتخب ڪلائنٽ شامل هئا جيڪي ٽريننگ سيٽ ۾ نه هئا. هائپر-پيراميٽر ماڊل لاءِ چونڊيا ويا ڪراس-تصديق استعمال ڪندي، ڪلائنٽ طرفان ٽوڙيل. خاصيتن جا ساڳيا سيٽ هر ماڊل کي تربيت ڏيڻ لاء استعمال ڪيا ويا.

انهي حقيقت جي ڪري ته ماڊل ۾ ميموري نه آهي، ان لاء خاص خاصيتون ورتيون ويون آهن، هڪ مهيني لاء پيٽرولن ۾ تبديلين جو تناسب ڏيکاري ٿو گذريل ٽن مهينن دوران پيٽرولن جي اوسط قدر تائين. ٽن مهينن جي آخري عرصي دوران قدرن ۾ تبديليءَ جي شرح جي خاصيت ڇا آهي. ان کان سواءِ، رينڊم فاريسٽ تي ٻڌل ماڊل Weibull-LSTM جي نسبت سان نقصان ۾ هوندو.

Weibull distribution سان LSTM ڇو هڪ ensemble فيصلي واري وڻ جي انداز کان بهتر آهي

هتي سڀ ڪجهه واضح آهي صرف چند تصويرن ۾.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
ڪلاسيڪل الگورتھم ۽ Weibull-LSTM لاءِ لفٽ وکر جو مقابلو

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
ڪلاسيڪل الگورتھم ۽ Weibull-LSTM لاءِ مهيني جي حساب سان لفٽ وکر ميٽرڪ جو مقابلو

عام طور تي، LSTM تقريبن سڀني ڪيسن ۾ ڪلاسيڪل الگورتھم کان مٿاهون آهي.

اڳڪٿي ڪرڻ

هڪ ماڊل بار بار نيورل نيٽ ورڪ جي بنياد تي LSTM سيلز سان گڏ Weibull تقسيم سان اڳڀرائي جي اڳڪٿي ڪري سگهي ٿو، مثال طور، ايندڙ n مهينن اندر گراهڪ جي چرن جي اڳڪٿي ڪريو. n = 3 لاءِ ڪيس تي غور ڪريو. ھن صورت ۾، ھر مھيني لاءِ، نيورل نيٽ ورڪ کي صحيح طور تي اھو طئي ڪرڻ گھرجي ته ڇا ڪلائنٽ ڇڏي ويندو، ايندڙ مھيني کان شروع ٿي ۽ پھرين مھيني تائين. ٻين لفظن ۾، اهو صحيح طور تي طئي ڪرڻ گهرجي ته ڇا گراهڪ n مهينن کان پوء رهندو. اهو سمجهي سگهجي ٿو اڳڪٿي اڳڪٿي: ان لمحي جي اڳڪٿي ڪندي جڏهن ڪلائنٽ صرف ڇڏڻ بابت سوچڻ شروع ڪيو هو.

اچو ته Weibull-LSTM 1، 2 ۽ 3 مھينن جي نڪرڻ کان اڳ لفٽ وکر جو مقابلو ڪريون:

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

اسان اڳ ۾ ئي مٿي لکي چڪا آهيون ته گراهڪن لاءِ ڪيل اڳڪٿيون جيڪي هاڻي ڪجهه وقت لاءِ سرگرم نه آهن پڻ اهم آهن. تنهن ڪري، هتي اسان نموني ۾ شامل ڪنداسين اهڙين ڪيسن ۾ جڏهن رخصت ٿيل گراهڪ اڳ ۾ ئي هڪ يا ٻن مهينن لاء غير فعال آهي، ۽ چيڪ ڪريو ته Weibull-LSTM اهڙين ڪيسن کي صحيح طور تي درجه بندي ڪري ٿو. جيئن ته اهڙا ڪيس نموني ۾ موجود هئا، اسان کي اميد آهي ته نيٽ ورڪ انهن کي چڱي طرح سنڀاليندو:

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

ڪسٽمر برقرار رکڻ

دراصل، اھو اھو بنيادي ڪم آھي جيڪو ٿي سگھي ٿو، ھٿ ۾ ڄاڻ ھجي ته اھڙا ۽ اھڙا گراهڪ مصنوعات کي استعمال ڪرڻ بند ڪرڻ جي تياري ڪري رھيا آھن. هڪ ماڊل ٺاهڻ جي ڳالهه ڪندي جيڪا گراهڪن کي ڪجهه مفيد پيش ڪري سگهي ٿي انهن کي برقرار رکڻ لاءِ، اهو نه ٿو ڪري سگهجي جيڪڏهن توهان وٽ اهڙين ڪوششن جي تاريخ نه آهي جيڪا ختم ٿي ويندي.

اسان وٽ اهڙي ڪهاڻي نه هئي، تنهنڪري اسان اهو فيصلو ڪيو.

  1. اسان هڪ ماڊل ٺاهي رهيا آهيون جيڪا هر ڪلائنٽ لاءِ دلچسپ شين جي سڃاڻپ ڪري ٿي.
  2. هر مهيني اسان درجيبندي کي هلائيندا آهيون ۽ ممڪن طور تي گراهڪن کي ڇڏڻ جي سڃاڻپ ڪندا آهيون.
  3. اسان ڪجهه گراهڪن کي پراڊڪٽ پيش ڪندا آهيون، پوائنٽ 1 جي ماڊل مطابق، ۽ اسان جي عملن کي ياد رکو.
  4. ڪجھ مھينن کان پوء، اسان ڏسون ٿا ته انھن مان ڪھڙو امڪاني طور تي ڪلائنٽ ڇڏي ويو ۽ جيڪو رھيو. اهڙيء طرح، اسان هڪ تربيتي نموني ٺاهيندا آهيون.
  5. قدم 4 ۾ حاصل ڪيل تاريخ کي استعمال ڪندي اسان ماڊل کي تربيت ڏيون ٿا.
  6. اختياري طور تي، اسان پروسيس کي ورجائي، قدم 1 کان ماڊل کي 5 ۾ حاصل ڪيل ماڊل سان تبديل ڪندي.

اهڙي برقرار رکڻ جي معيار جو هڪ امتحان باقاعده A/B ٽيسٽنگ ذريعي ڪري سگهجي ٿو - اسان انهن گراهڪن کي ورهايون ٿا جيڪي ممڪن طور تي ٻن گروپن ۾ ڇڏي وڃن ٿا. اسان ھڪڙو پراڊڪٽ پيش ڪندا آھيون ھڪڙي کي پنھنجي برقرار رکڻ واري ماڊل جي بنياد تي، ۽ ٻئي کي اسان ڪجھ به نه پيش ڪندا آھيون. اسان ھڪڙو نمونو ٽرين ڪرڻ جو فيصلو ڪيو جيڪو اسان جي مثال جي پوائنٽ 1 تي اڳ ۾ ئي ڪارائتو ٿي سگھي ٿو.

اسان چاهيون ٿا ته ڀاڱيداري کي ممڪن طور قابل تفسير. هن کي ڪرڻ لاء، اسان ڪيترن ئي خاصيتن کي چونڊيو آهي جيڪي آساني سان تشريح ڪري سگهجن ٿيون: ٽرانزيڪشن جو ڪل تعداد، اجرت، ڪل اڪائونٽ ٽران اوور، عمر، جنس. "نقشي" جي جدول مان خصوصيتن کي غير معلوماتي طور تي حساب ۾ نه ورتو ويو، ۽ جدول 3 مان خاصيتون "معاهدو" جي پروسيسنگ جي پيچيدگي سبب حساب ۾ نه ورتو ويو ته جيئن تصديق جي سيٽ ۽ ٽريننگ سيٽ جي وچ ۾ ڊيٽا ليڪ ٿيڻ کان بچڻ لاء.

ڪلسترنگ گاسي مرکب ماڊل استعمال ڪندي ڪيو ويو. Akaike ڄاڻ جي معيار اسان کي 2 optima مقرر ڪرڻ جي اجازت ڏني. پهريون بهترين 1 ڪلستر سان ملندو آهي. ٻيو بهترين، گهٽ بيان ڪيل، 80 ڪلستر سان ملندو آهي. ھن نتيجي جي بنياد تي، اسان ھيٺ ڏنل نتيجو ڪڍي سگھون ٿا: ڊيٽا کي ڪلسٽرن ۾ ورهائڻ تمام ڏکيو آھي بغير ڄاڻ ڏني وئي. بهتر ڪلسٽرنگ لاءِ، توهان کي ڊيٽا جي ضرورت آهي جيڪا هر ڪلائنٽ کي تفصيل سان بيان ڪري.

تنهن ڪري، نگراني ٿيل سکيا جو مسئلو سمجهيو ويو ته هر فرد جي ڪلائنٽ کي مختلف پيداوار پيش ڪرڻ لاء. هيٺ ڏنل پراڊڪٽس تي غور ڪيو ويو: "مدت جمع"، "ڪريڊٽ ڪارڊ"، "اوور ڊرافٽ"، "صارف قرض"، "ڪار قرض"، " گروي".

ڊيٽا ۾ ھڪڙو وڌيڪ قسم جو پراڊڪٽ شامل آھي: ”موجوده اڪائونٽ“. پر ان جي گهٽ معلوماتي مواد جي ڪري اسان ان تي غور نه ڪيو. صارفين لاء جيڪي بينڪ ڪلائنٽ آهن، يعني. پنهنجي پروڊڪٽس کي استعمال ڪرڻ بند نه ڪيو، هڪ ماڊل تيار ڪيو ويو ته اڳڪٿي ڪرڻ لاءِ ته ڪهڙي پراڊڪٽ انهن لاءِ دلچسپي رکي ٿي. لاجسٽڪ ريگريشن کي ماڊل طور چونڊيو ويو، ۽ پهرين 10 پرسنٽائل لاءِ لفٽ ويليو استعمال ڪيو ويو معيار جي تشخيص ميٽرڪ طور.

ماڊل جي معيار کي تصوير ۾ اندازو لڳائي سگهجي ٿو.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان
پراڊڪٽ سفارش ماڊل جا نتيجا گراهڪن لاءِ

نتيجو

اهو طريقو اسان کي RAIF-چيلنج 2017 AI چيمپئن شپ ۾ "AI in Banks" جي درجي ۾ پهرين جڳهه تي پهچايو.

اسان ڪيئن اڳڪٿي ڪئي ته ان کي قدرتي آفت جي ويجهو اچڻ سان

ظاهري طور تي، بنيادي شيء هڪ غير روايتي زاوي کان مسئلي کي منهن ڏيڻ ۽ هڪ طريقو استعمال ڪرڻ هو جيڪو عام طور تي ٻين حالتن لاء استعمال ڪيو ويندو آهي.

جيتوڻيڪ صارفين جو هڪ وڏو نڪرڻ شايد خدمتن لاء قدرتي آفت آهي.

اهو طريقو ڪنهن ٻئي علائقي جي حساب سان ورتو وڃي ٿو جتي اهو ضروري آهي ته اڪائونٽ ٻاهر نڪرڻ کي، نه رڳو بينڪن کي. مثال طور، اسان ان کي استعمال ڪيو اسان جي پنهنجي نڪرڻ جي حساب سان - Rostelecom جي سائبرين ۽ سينٽ پيٽرسبرگ شاخن ۾.

"ڊيٽا مائننگ ليبارٽري" ڪمپني "سرچ پورٽل "اسپوتنڪ"

جو ذريعو: www.habr.com

تبصرو شامل ڪريو