Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Ba'zida muammoni hal qilish uchun unga boshqa tomondan qarash kerak bo'ladi. So'nggi 10 yil ichida shunga o'xshash muammolar turli xil effektlar bilan bir xil tarzda hal qilingan bo'lsa ham, bu usul yagona ekanligi haqiqat emas.

Mijozlarni yo'qotish kabi mavzu mavjud. Bu muqarrar, chunki har qanday kompaniyaning mijozlari ko'p sabablarga ko'ra o'z mahsulotlari yoki xizmatlaridan foydalanishni to'xtatishi mumkin. Albatta, kompaniya uchun ishdan chiqish tabiiy, ammo eng maqbul harakat emas, shuning uchun har bir kishi bu nosozlikni minimallashtirishga harakat qiladi. Yaxshisi, foydalanuvchilarning ma'lum bir toifasi yoki ma'lum bir foydalanuvchi uchun ishlamay qolish ehtimolini taxmin qiling va ularni saqlab qolish uchun ba'zi qadamlarni taklif qiling.

Iloji bo'lsa, hech bo'lmaganda quyidagi sabablarga ko'ra mijozni tahlil qilish va ushlab turishga harakat qilish kerak:

  • yangi mijozlarni jalb qilish saqlash tartib-qoidalariga qaraganda qimmatroq. Yangi mijozlarni jalb qilish uchun, qoida tariqasida, siz bir oz pul sarflashingiz kerak (reklama), mavjud mijozlar esa maxsus shartlar bilan maxsus taklif bilan faollashtirilishi mumkin;
  • Mijozlarni tark etish sabablarini tushunish mahsulot va xizmatlarni yaxshilashning kalitidir.

Buzilishni bashorat qilishning standart yondashuvlari mavjud. Ammo AI chempionatlaridan birida biz buning uchun Weibull taqsimotini sinab ko'rishga qaror qildik. U ko'pincha omon qolish qobiliyatini tahlil qilish, ob-havo prognozi, tabiiy ofatlarni tahlil qilish, sanoat muhandisligi va boshqalar uchun ishlatiladi. Weibull taqsimoti ikkita parametr bilan parametrlangan maxsus taqsimlash funktsiyasidir Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik и Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Vikipediya

Umuman olganda, bu qiziq narsa, lekin chiqishlarni bashorat qilish uchun va umuman fintechda u tez-tez ishlatilmaydi. Quyida biz (Data Mining Laboratory) buni qanday amalga oshirganimizni va bir vaqtning o'zida sun'iy intellekt chempionatida "Banklarda AI" nominatsiyasida oltin medalni qo'lga kiritganimizni aytib beramiz.

Umuman charchoq haqida

Keling, mijozlarning noroziligi nima ekanligini va nima uchun bu juda muhimligini bir oz tushunib olaylik. Mijozlar bazasi biznes uchun muhimdir. Ushbu bazaga yangi mijozlar keladi, masalan, reklama orqali mahsulot yoki xizmat haqida bilib, bir muncha vaqt yashaydi (mahsulotlardan faol foydalaning) va bir muncha vaqt o'tgach, undan foydalanishni to'xtatadi. Bu davr “mijozning hayotiy sikli” deb nomlanadi – bu atama mijoz mahsulot haqida bilib olgani, xarid qilish to‘g‘risida qaror qabul qilgani, to‘lagani, foydalanadigan va sodiq iste’molchiga aylangani va pirovardida mahsulotdan foydalanishni to‘xtatgan bosqichlarni tavsiflaydi. u yoki bu sababga ko'ra. Shunga ko'ra, ishlamay qolish mijozning hayot aylanishining yakuniy bosqichi bo'lib, mijoz xizmatlardan foydalanishni to'xtatadi va biznes uchun bu mijoz foyda yoki umuman foyda keltirishni to'xtatganligini anglatadi.

Har bir bank mijozi o'z ehtiyojlari uchun u yoki bu bank kartasini tanlagan aniq shaxsdir. Agar siz tez-tez sayohat qilsangiz, millari bo'lgan karta foydali bo'ladi. Ko'p sotib oladi - salom, cashback kartasi. U ma'lum do'konlarda ko'p narsalarni sotib oladi - va buning uchun allaqachon maxsus sherik plastik mavjud. Albatta, ba'zida "Eng arzon xizmat" mezoniga ko'ra karta tanlanadi. Umuman olganda, bu erda o'zgaruvchilar etarli.

Va odam bankni o'zi ham tanlaydi - siz Xabarovskdan bo'lganingizda, filiallari faqat Moskva va mintaqada bo'lgan bankdan kartani tanlashning ma'nosi bormi? Bunday bankning kartasi kamida 2 baravar foydali bo'lsa ham, yaqin atrofda bank filiallarining mavjudligi hali ham muhim mezondir. Ha, 2019 yil allaqachon keldi va raqamli - bizning hamma narsamiz, lekin ba'zi banklar bilan bog'liq bir qator muammolarni faqat filialda hal qilish mumkin. Bundan tashqari, aholining bir qismi smartfondagi ilovadan ko'ra ko'proq jismoniy bankka ishonadi, buni ham hisobga olish kerak.

Natijada, odamda bank mahsulotlarini (yoki bankning o'zi) rad etish uchun ko'plab sabablar bo'lishi mumkin. Men ish joyini o'zgartirdim va karta tarifi maoshdan "Odamlar uchun" ga o'zgardi, bu unchalik foydali emas. Men bank filiallari bo'lmagan boshqa shaharga ko'chib o'tdim. Menga filialda malakasiz operator bilan munosabat yoqmadi. Ya'ni, hisobni yopish uchun mahsulotdan foydalanishdan ko'ra ko'proq sabablar bo'lishi mumkin.

Va mijoz nafaqat o'z niyatini aniq ifodalashi mumkin - bankka kelib, bayonot yozishi, balki shartnomani bekor qilmasdan mahsulotlardan foydalanishni to'xtatishi mumkin. Bunday muammolarni tushunish uchun mashinani o'rganish va AIdan foydalanishga qaror qilindi.

Bundan tashqari, mijozlarning ishlamay qolishi har qanday sohada (telekom, Internet provayderlari, sug'urta kompaniyalari, umuman olganda, mijozlar bazasi va davriy operatsiyalar mavjud bo'lgan joyda) sodir bo'lishi mumkin.

Biz nima qildik

Avvalo, aniq chegarani tasvirlash kerak edi - qaysi vaqtdan boshlab biz mijozni tark etgan deb hisoblashni boshlaymiz. Bizning ishimiz uchun ma'lumotlarni taqdim etgan bank nuqtai nazaridan, mijozning faoliyati ikkilik edi - u faol yoki yo'q. "Faoliyat" jadvalida ACTIVE_FLAG bayrog'i mavjud edi, uning qiymati "0" yoki "1" bo'lishi mumkin (mos ravishda "Faol" va "Faol"). Va hamma narsa yaxshi bo'lar edi, lekin odam shundayki, u bir muncha vaqt faol foydalanishi mumkin, keyin esa bir oy davomida faol ro'yxatdan tushib qoladi - u kasal bo'lib qoldi, ta'tilga boshqa mamlakatga ketdi yoki hatto sinovdan o'tishga ketdi. boshqa bankdan karta. Yoki uzoq vaqt harakatsizlikdan keyin bank xizmatlaridan yana foydalanishni boshlang

Shuning uchun biz harakatsizlik davrini ma'lum bir doimiy vaqt davri deb atashga qaror qildik, bu vaqt davomida uning bayrog'i "0" ga o'rnatilgan.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Mijozlar turli uzunlikdagi harakatsizlik davrlaridan keyin faol bo'lmagandan faolga o'tadi. Bizda "harakatsizlik davrlarining ishonchliligi" ning empirik qiymati darajasini - ya'ni vaqtincha harakatsizlikdan keyin odam bank mahsulotlaridan yana foydalanishni boshlash ehtimolini hisoblash imkoniyati mavjud.

Misol uchun, ushbu grafikda bir necha oylik harakatsizlikdan so'ng (ACTIVE_FLAG=1) mijozlar faoliyatining qayta tiklanishi (ACTIVE_FLAG=0) ko'rsatilgan.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Bu erda biz ishlashni boshlagan ma'lumotlar to'plamiga biroz aniqlik kiritamiz. Shunday qilib, bank 19 oy davomida jamlangan ma'lumotlarni quyidagi jadvallarda taqdim etdi:

  • "Faoliyat" - mijozlarning oylik operatsiyalari (kartalar bo'yicha, Internet-banking va mobil bankingda), shu jumladan ish haqi va aylanma to'g'risidagi ma'lumotlar.
  • "Kartalar" - batafsil tarif jadvali bilan mijozning barcha kartalari haqidagi ma'lumotlar.
  • "Shartnomalar" - mijozning shartnomalari (ochiq va yopiq) to'g'risidagi ma'lumotlar: har birining parametrlarini ko'rsatadigan kreditlar, depozitlar va boshqalar.
  • "Mijozlar" - demografik ma'lumotlar to'plami (jins va yosh) va aloqa ma'lumotlarining mavjudligi.

Ish uchun bizga "Xarita" dan tashqari barcha jadvallar kerak edi.

Bu erda yana bir qiyinchilik bor edi - bu ma'lumotlarda bank kartalarda qanday faoliyat sodir bo'lganligini ko'rsatmagan. Ya'ni, biz tranzaktsiyalar bor yoki yo'qligini tushunishimiz mumkin edi, lekin biz endi ularning turini aniqlay olmadik. Shu sababli, mijoz naqd pul olayotgani, ish haqi olgani yoki pulni xaridlarga sarflayotgani noma'lum edi. Hisobdagi qoldiqlar haqida ham bizda ma'lumotlar yo'q edi, bu foydali bo'lar edi.

Namunaning o'zi xolis edi - bu namunada, 19 oy davomida bank mijozlarni ushlab qolish va chiqib ketishni minimallashtirish uchun hech qanday harakat qilmadi.

Shunday qilib, harakatsizlik davrlari haqida.

Ishlamay qolishning ta'rifini shakllantirish uchun harakatsizlik davrini tanlash kerak. Bir vaqtning o'zida charchoq prognozini yaratish Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik, siz intervalda kamida 3 oylik mijoz tarixiga ega bo'lishingiz kerak Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik. Bizning tariximiz 19 oy bilan cheklangan edi, shuning uchun agar mavjud bo'lsa, biz 6 oylik harakatsizlik davrini olishga qaror qildik. Va yuqori sifatli prognoz uchun minimal muddat uchun biz 3 oyni oldik. Biz mijozlar ma'lumotlarining xatti-harakatlarini tahlil qilish asosida empirik tarzda 3 va 6 oylik raqamlarni oldik.

Biz ishlamay qolishning ta'rifini quyidagicha shakllantirdik: mijozning ishlamay qolgan oyi Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik bu ACTIVE_FLAG=0 bo'lgan birinchi oy, bu oydan boshlab ACTIVE_FLAG maydonida kamida oltita ketma-ket nol mavjud, boshqacha qilib aytganda, mijoz 6 oy davomida faol bo'lmagan oy.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Ketgan mijozlar soni

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Qolgan mijozlar soni

Chiqish qanday hisoblanadi?

Bunday musobaqalarda va umuman amaliyotda ko'pincha chiqish shu tarzda bashorat qilinadi. Mijoz turli vaqtlarda mahsulot va xizmatlardan foydalanadi, u bilan o'zaro ta'sir qilish to'g'risidagi ma'lumotlar belgilangan uzunlikdagi n xususiyatlarining vektori sifatida taqdim etiladi. Ko'pincha bu ma'lumotlarga quyidagilar kiradi:

  • Foydalanuvchini tavsiflovchi ma'lumotlar (demografik ma'lumotlar, marketing segmenti).
  • Bank mahsulotlari va xizmatlaridan foydalanish tarixi (bu har doim bizga kerak bo'lgan vaqt oralig'ining ma'lum bir vaqtiga yoki davriga bog'liq bo'lgan mijozlar harakatlaridir).
  • Tashqi ma'lumotlar, agar uni olish mumkin bo'lsa - masalan, ijtimoiy tarmoqlardagi sharhlar.

Va shundan so'ng ular har bir vazifa uchun har xil bo'lgan chalkashlik ta'rifini oladilar. Keyin ular mijozning ketishi ehtimolini bashorat qiluvchi mashinani o'rganish algoritmidan foydalanadilar Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik omillar vektoriga asoslanadi Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik. Algoritmni o'rgatish uchun qaror daraxtlari ansambllarini qurish uchun taniqli ramkalardan biri qo'llaniladi, XGBoost, LightGBM, CatBoost yoki ularning o'zgartirishlari.

Algoritmning o'zi yomon emas, lekin ishdan chiqishni bashorat qilishda bir qancha jiddiy kamchiliklarga ega.

  • Unda "xotira" yo'q.. Modelning kiritilishi - vaqtning joriy nuqtasiga mos keladigan xususiyatlarning belgilangan soni. Parametrlarning o'zgarishi tarixi haqidagi ma'lumotlarni saqlash uchun vaqt o'tishi bilan parametrlarning o'zgarishini tavsiflovchi maxsus xususiyatlarni hisoblash kerak, masalan, oxirgi 1,2,3, XNUMX, XNUMX oy ichida bank operatsiyalari soni yoki miqdori. Ushbu yondashuv vaqtinchalik o'zgarishlarning tabiatini faqat qisman aks ettirishi mumkin.
  • Ruxsat etilgan prognoz gorizonti. Model faqat oldindan belgilangan vaqt oralig'ida, masalan, bir oy oldin prognoz qilish uchun mijozlarning ishdan chiqishini bashorat qila oladi. Agar prognoz boshqa vaqt uchun, masalan, uch oy uchun zarur bo'lsa, unda siz o'quv majmuasini qayta qurishingiz va yangi modelni qayta tayyorlashingiz kerak.

Bizning yondashuvimiz

Biz darhol standart yondashuvlardan foydalanmaslikka qaror qildik. Chempionatda bizdan tashqari yana 497 kishi ro'yxatdan o'tgan bo'lib, ularning har birida katta tajriba bor. Shunday qilib, bunday sharoitda standart sxema bo'yicha biror narsa qilishga urinish yaxshi fikr emas.

Va biz ikkilik tasniflash modeli oldida turgan muammolarni mijozlarning ishlamay qolish vaqtlarini taqsimlash ehtimolini bashorat qilish orqali hal qila boshladik. Shunga o'xshash yondashuvni ko'rish mumkin shu yerda, bu sizga klassik yondashuvga qaraganda chayqalishni yanada moslashuvchan bashorat qilish va murakkabroq farazlarni sinab ko'rish imkonini beradi. Chiqib ketish vaqtini modellashtiruvchi taqsimotlar oilasi sifatida biz tarqatishni tanladik Veybull omon qolish tahlilida keng qo'llanilishi uchun. Mijozning xatti-harakati omon qolishning bir turi sifatida ko'rib chiqilishi mumkin.

Bu erda parametrlarga qarab Weibull ehtimollik zichligi taqsimotiga misollar keltirilgan Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik и Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik:

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Bu vaqt o'tishi bilan uch xil mijozlarning ishlamay qolish ehtimoli zichligi funksiyasi. Vaqt oylarda ko'rsatilgan. Boshqacha qilib aytadigan bo'lsak, ushbu grafik mijozning keyingi ikki oy ichida eng ko'p ishlamay qolish ehtimolini ko'rsatadi. Ko'rib turganingizdek, distribyutorga ega bo'lgan mijoz Weibull(2, 0.5) va Weibull mijozlariga qaraganda tezroq ketish imkoniyatiga ega. (3,1) taqsimotlar.

Natijada, har bir mijoz uchun, har bir mijoz uchun model
oy Veybull taqsimotining parametrlarini bashorat qiladi, bu vaqt o'tishi bilan chiqib ketish ehtimoli paydo bo'lishini eng yaxshi aks ettiradi. Batafsilroq:

  • Trening to'plamidagi maqsadli xususiyatlar - bu ma'lum bir mijoz uchun ma'lum bir oyda ishlamay qolguncha qolgan vaqt.
  • Agar mijoz uchun ishlamay qolish darajasi bo'lmasa, biz uzilish vaqti joriy oydan bizda mavjud bo'lgan tarixning oxirigacha bo'lgan oylar sonidan kattaroq deb taxmin qilamiz.
  • Amaldagi model: LSTM qatlami bilan takrorlanuvchi neyron tarmoq.
  • Yo'qotish funktsiyasi sifatida biz Weibull taqsimoti uchun salbiy log-ehtimollik funksiyasidan foydalanamiz.

Mana bu usulning afzalliklari:

  • Ehtimollarni taqsimlash, ikkilik tasniflashning aniq imkoniyatidan tashqari, turli hodisalarni moslashuvchan bashorat qilish imkonini beradi, masalan, mijoz 3 oy ichida bank xizmatlaridan foydalanishni to'xtatadimi. Bundan tashqari, agar kerak bo'lsa, ushbu taqsimot bo'yicha turli ko'rsatkichlarni o'rtacha hisoblash mumkin.
  • LSTM takroriy neyron tarmog'i xotiraga ega va butun mavjud tarixdan samarali foydalanadi. Hikoya kengaytirilsa yoki takomillashtirilsa, aniqlik oshadi.
  • Vaqt davrlarini kichikroqlarga bo'lishda (masalan, oylarni haftalarga bo'lishda) yondashuvni osonlik bilan kengaytirish mumkin.

Ammo yaxshi model yaratish uchun bu etarli emas, shuningdek, uning sifatini to'g'ri baholashingiz kerak.

Sifat qanday baholandi?

Metrik sifatida biz Lift Curve ni tanladik. Aniq talqini tufayli bunday holatlar uchun biznesda qo'llaniladi, u yaxshi tasvirlangan shu yerda и shu yerda. Agar siz ushbu ko'rsatkichning ma'nosini bitta jumlada tasvirlasangiz, u "Algoritm birinchi navbatda necha marta eng yaxshi bashorat qiladi" bo'ladi. Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildiktasodifiy emas."

Trening modellari

Raqobat shartlari turli modellar va yondashuvlarni solishtirish mumkin bo'lgan aniq sifat ko'rsatkichini o'rnatmagan. Bundan tashqari, buzilishning ta'rifi har xil bo'lishi mumkin va muammoning bayoniga bog'liq bo'lishi mumkin, bu esa o'z navbatida biznes maqsadlari bilan belgilanadi. Shuning uchun, qaysi usul yaxshiroq ekanligini tushunish uchun biz ikkita modelni o'qidik:

  1. Ansambl qaror daraxti mashinasini o'rganish algoritmidan foydalangan holda keng tarqalgan ishlatiladigan ikkilik tasniflash usuli (LightGBM);
  2. Weibull-LSTM modeli

Test to'plami o'quv majmuasida bo'lmagan 500 ta oldindan tanlangan mijozlardan iborat edi. Giper-parametrlar model uchun mijoz tomonidan bo'lingan o'zaro tekshirish yordamida tanlangan. Har bir modelni o'qitish uchun bir xil funktsiyalar to'plami ishlatilgan.

Modelda xotira yo'qligi sababli, u uchun bir oy davomida parametrlar o'zgarishining oxirgi uch oydagi parametrlarning o'rtacha qiymatiga nisbatini ko'rsatadigan maxsus xususiyatlar olindi. Oxirgi uch oy davomida qiymatlarning o'zgarish tezligi nima bilan tavsiflanadi. Busiz, Tasodifiy o'rmonga asoslangan model Weibull-LSTM ga nisbatan noqulay ahvolga tushib qoladi.

Nega Weibull tarqatish bilan LSTM ansambl qarorlar daraxti yondashuvidan yaxshiroqdir

Bu erda bir nechta rasmda hamma narsa aniq.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Klassik algoritm va Weibull-LSTM uchun Lift Curve ni solishtirish

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Klassik algoritm va Weibull-LSTM uchun Lift Curve ko'rsatkichini oylar bo'yicha taqqoslash

Umuman olganda, LSTM deyarli barcha holatlarda klassik algoritmdan ustundir.

Nosozlikni bashorat qilish

Weibull taqsimotiga ega LSTM xujayralari bilan takrorlanuvchi neyron tarmoqqa asoslangan model ishdan chiqishini oldindan bashorat qilishi mumkin, masalan, keyingi n oy ichida mijozlarning ishlamay qolishini bashorat qilish. N = 3 uchun ishni ko'rib chiqing. Bu holda, har bir oy uchun, neyron tarmoq mijozning keyingi oydan boshlab va n oygacha ketishini to'g'ri aniqlashi kerak. Boshqacha qilib aytganda, u mijozning n oydan keyin qolish-qolmasligini to'g'ri aniqlashi kerak. Buni oldindan prognoz deb hisoblash mumkin: mijoz endi ketish haqida o'ylay boshlagan paytni bashorat qilish.

Chiqib ketishdan 1, 2 va 3 oy oldin Weibull-LSTM uchun Lift Curve ni solishtiramiz:

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Bir muncha vaqt faol bo'lmagan mijozlar uchun qilingan prognozlar ham muhim ekanligini yuqorida yozgan edik. Shuning uchun, biz bu erda namunaga ketgan mijoz allaqachon bir yoki ikki oy davomida faol bo'lmagan holatlarni qo'shamiz va Weibull-LSTM bunday holatlarni ishdan chiqish deb to'g'ri tasniflaganligini tekshiramiz. Namunada bunday holatlar mavjud bo'lganligi sababli, biz tarmoq ularni yaxshi boshqarishini kutamiz:

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Mijozlarni ushlab turish

Aslida, bu shunday va shunga o'xshash mijozlar mahsulotdan foydalanishni to'xtatishga tayyorlanayotgani haqida qo'lda ma'lumotga ega bo'lgan holda amalga oshirilishi mumkin bo'lgan asosiy narsa. Mijozlarni saqlab qolish uchun foydali narsalarni taklif qilishi mumkin bo'lgan modelni yaratish haqida gapiradigan bo'lsak, agar sizda yaxshi yakunlanadigan shunga o'xshash urinishlar tarixi bo'lmasa, buni amalga oshirib bo'lmaydi.

Bizda bunday hikoya yo'q edi, shuning uchun biz buni shunday qaror qildik.

  1. Biz har bir mijoz uchun qiziqarli mahsulotlarni aniqlaydigan modelni yaratmoqdamiz.
  2. Har oy biz tasniflagichni ishga tushiramiz va potentsial tark etuvchi mijozlarni aniqlaymiz.
  3. Biz ba'zi mijozlarga 1-banddagi modelga muvofiq mahsulotni taklif qilamiz va harakatlarimizni eslaymiz.
  4. Bir necha oydan so'ng biz ushbu potentsial tark etishi mumkin bo'lgan mijozlardan qaysi biri ketgan va qaysi biri qolganini ko'rib chiqamiz. Shunday qilib, biz o'quv namunasini shakllantiramiz.
  5. Biz 4-bosqichda olingan tarix yordamida modelni o'rgatamiz.
  6. Majburiy emas, biz 1-bosqichdagi modelni 5-bosqichda olingan model bilan almashtirib, protsedurani takrorlaymiz.

Bunday saqlash sifatini tekshirish muntazam A/B testi orqali amalga oshirilishi mumkin - biz potentsial tark etadigan mijozlarni ikki guruhga ajratamiz. Biz biriga mahsulotlarni saqlash modelimiz asosida taklif qilamiz, ikkinchisiga esa hech narsa taklif qilmaymiz. Biz misolimizning 1-bandida foydali bo'lishi mumkin bo'lgan modelni tayyorlashga qaror qildik.

Biz segmentatsiyani iloji boricha talqin qilinishini xohladik. Buning uchun biz osongina talqin qilinishi mumkin bo'lgan bir nechta xususiyatlarni tanladik: tranzaktsiyalarning umumiy soni, ish haqi, umumiy hisob aylanmasi, yosh, jins. "Xaritalar" jadvalidagi xususiyatlar ma'lumotga ega bo'lmagan sifatida hisobga olinmadi va 3-jadvaldagi "Shartnomalar" xususiyatlari, tekshirish to'plami va o'quv to'plami o'rtasida ma'lumotlar sizib chiqmasligi uchun ishlov berishning murakkabligi sababli hisobga olinmadi.

Klasterlash Gauss aralashmasi modellari yordamida amalga oshirildi. Akaike axborot mezoni bizga 2 ta optimalni aniqlash imkonini berdi. Birinchi optimal 1 klasterga to'g'ri keladi. Ikkinchi optimal, kamroq aniq, 80 ta klasterga to'g'ri keladi. Ushbu natijaga asoslanib, biz quyidagi xulosaga kelishimiz mumkin: aprior ma'lumotsiz ma'lumotlarni klasterlarga bo'lish juda qiyin. Yaxshiroq klasterlash uchun sizga har bir mijozni batafsil tavsiflovchi ma'lumotlar kerak bo'ladi.

Shu sababli, har bir mijozga har xil mahsulotni taklif qilish uchun nazorat ostida o'qitish muammosi ko'rib chiqildi. “Muddatli depozit”, “Kredit karta”, “Overdraft”, “Iste’mol krediti”, “Avtomobil krediti”, “Ipoteka” kabi mahsulotlar ko‘rib chiqildi.

Ma'lumotlarga yana bir turdagi mahsulot kiradi: "Joriy hisob". Ammo ma'lumotlarning pastligi sababli biz buni hisobga olmadik. Bank mijozlari bo'lgan foydalanuvchilar uchun, ya'ni. o'z mahsulotlarini ishlatishni to'xtatmadi, qaysi mahsulot ularni qiziqtirishi mumkinligini taxmin qilish uchun model qurildi. Model sifatida logistik regressiya tanlandi va sifatni baholash ko'rsatkichi sifatida birinchi 10 foizlik ko'tarilish qiymati ishlatilgan.

Modelning sifati rasmda baholanishi mumkin.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik
Mijozlar uchun mahsulot tavsiya modeli natijalari

Xulosa

Ushbu yondashuv bizga RAIF-Challenge 2017 AI chempionatida "Banklarda AI" toifasida birinchi o'rinni olib keldi.

Qanday qilib biz tabiiy ofat kabi yaqinlashib, chayqalishni bashorat qildik

Ko'rinib turibdiki, asosiy narsa muammoga noan'anaviy burchakdan yondashish va odatda boshqa holatlar uchun qo'llaniladigan usuldan foydalanish edi.

Garchi foydalanuvchilarning katta miqdorda chiqib ketishi xizmatlar uchun tabiiy ofat bo'lishi mumkin.

Bu usul faqat banklarni emas, balki chiqib ketishni hisobga olish muhim bo'lgan boshqa har qanday soha uchun hisobga olinishi mumkin. Misol uchun, biz o'zimizning chiqishimizni hisoblash uchun foydalandik - Rostelekomning Sibir va Sankt-Peterburg filiallarida.

"Ma'lumotlarni qazib olish laboratoriyasi" kompaniyasi "Sputnik" qidiruv portali

Manba: www.habr.com

a Izoh qo'shish