Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Кээде көйгөйдү чечүү үчүн жөн гана башка бурчтан кароо керек. Акыркы 10 жылдын ичинде ушул сыяктуу көйгөйлөр ар кандай эффектилер менен бирдей чечилсе да, бул ыкма жалгыз экени чындык эмес.

Кардарларды кыйнап алуу деген тема бар. Бул нерсе сөзсүз болот, анткени ар бир компаниянын кардарлары көптөгөн себептерден улам анын өнүмдөрүн же кызматтарын колдонууну токтотушу мүмкүн. Албетте, компания үчүн кыйроо табигый көрүнүш, бирок эң керектүү иш эмес, андыктан ар бир адам бул кыйроону минималдаштырууга аракет кылат. Дагы жакшы, колдонуучулардын белгилүү бир категориясы же белгилүү бир колдонуучу үчүн иштебей калуу ыктымалдыгын алдын ала айтыңыз жана аларды сактап калуу үчүн бир нече кадамдарды сунуштаңыз.

Мүмкүн болсо, жок дегенде төмөнкү себептерден улам кардарды талдап, кармап калууга аракет кылуу зарыл:

  • жаңы кардарларды тартуу сактоо жол-жоболоруна караганда кымбатыраак. жаңы кардарларды тартуу үчүн, эреже катары, бир аз акча (жарнак) коротуу керек, ал эми учурдагы кардарларды өзгөчө шарттар менен атайын сунуш менен активдештирүүгө болот;
  • Кардарлар эмне үчүн кетип жатканын түшүнүү өнүмдөрдү жана кызматтарды жакшыртуунун ачкычы болуп саналат.

Чыгууну алдын ала айтуунун стандарттуу ыкмалары бар. Бирок AI чемпионаттарынын биринде биз бул үчүн Weibull бөлүштүрүүнү сынап көрүүнү чечтик. Көбүнчө жашоо жөндөмдүүлүгүн талдоо, аба ырайын болжолдоо, табигый кырсыктарды талдоо, өнөр жай инженериясы жана башкалар үчүн колдонулат. Weibull бөлүштүрүү - эки параметр менен параметрленген өзгөчө бөлүштүрүү функциясы Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз и Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Wikipedia

Жалпысынан алганда, бул кызыктуу нерсе, бирок агып чыгууну болжолдоо үчүн, ал эми жалпысынан финтехте ал көп колдонулбайт. Төмөндө биз (Data Mining Laboratory) муну кантип жасаганыбызды айтып беребиз, ошол эле учурда Жасалма интеллект чемпионатында "Банктарда AI" категориясында алтын утуп алганбыз.

Жалпысынан чабуул тууралуу

Келгиле, кардарлардын бузулушу деген эмне экенин жана ал эмне үчүн абдан маанилүү экенин бир аз түшүнүп алалы. Кардар базасы бизнес үчүн маанилүү. Бул базага жаңы кардарлар келишет, мисалы, өнүм же кызмат жөнүндө жарнамадан билип, бир канча убакыт жашап (продукцияларды активдүү колдонушат) жана бир аз убакыт өткөндөн кийин аны колдонууну токтотушат. Бул мезгил "Кардардын жашоо цикли" деп аталат - бул термин кардар товар жөнүндө билип, сатып алуу чечимин кабыл алган, төлөгөн, колдонгон жана ишенимдүү керектөөчү болгон жана акырында продуктуну колдонууну токтоткон этаптарды сүрөттөйт. тигил же бул себептерден улам. Тиешелүү түрдө, кардардын жашоо циклинин акыркы этабы, кардар кызматтарды колдонууну токтотот, ал эми бизнес үчүн бул кардар пайда же кандайдыр бир пайда алып келбейт дегенди билдирет.

Ар бир банк кардары – бул тигил же бул банк картасын өзүнүн муктаждыктары үчүн тандаган конкреттүү адам. Эгер сиз көп саякатка чыксаңыз, милясы бар карта жардамга келет. Көп сатып алат - салам, кэшбэк картасы. Ал белгилүү дүкөндөрдө көп сатып алат - бул үчүн атайын өнөктөш пластик бар. Албетте, кээде карта "Эң арзан кызмат" критерийинин негизинде тандалып алынат. Жалпысынан алганда, бул жерде өзгөрмөлөр жетиштүү.

Ал эми банкты адам өзү да тандайт - сиз Хабаровск шаарынан болгондо, филиалдары Москвада жана аймакта гана болгон банктан картаны тандоонун мааниси барбы? Мындай банктын картасы жок дегенде 2 эсе кирешелүү болсо дагы, жакын жерде банк бөлүмдөрүнүн болушу дагы эле маанилүү критерий болуп саналат. Ооба, 2019-жыл мурунтан эле келди жана санариптик биздин бардыгыбыз, бирок кээ бир банктар менен болгон бир катар маселелер филиалда гана чечилиши мүмкүн. Мындан тышкары, калктын кээ бир бөлүгү смартфондогу тиркемеге караганда физикалык банкка көбүрөөк ишенет, муну да эске алуу керек.

Натыйжада, адам банк продуктыларынан (же банктын өзү) баш тартуу үчүн көптөгөн себептерге ээ болушу мүмкүн. Мен жумушумду алмаштырдым, ал эми картанын тарифи айлык акыдан “Жөн эле өлүктөр үчүн” болуп өзгөрдү, бул азыраак кирешелүү. Мен банктын филиалдары жок башка шаарга көчүп кеттим. Филиалдагы квалификациясы жок оператор менен болгон мамилем мага жаккан жок. Башкача айтканда, продуктту колдонууга караганда эсепти жабуу үчүн дагы көп себептер болушу мүмкүн.

Ал эми кардар өз ниетин ачык эле билдирбестен – банкка келип арыз жазып, келишимди бузбай туруп эле продукцияны колдонууну токтото алат. Мындай көйгөйлөрдү түшүнүү үчүн машина үйрөнүү жана AI колдонуу чечими кабыл алынды.

Мындан тышкары, кардарлардын бузулушу ар кандай тармакта (телеком, интернет-провайдерлер, камсыздандыруу компаниялары, жалпысынан, кардар базасы жана мезгилдүү транзакциялар бар жерде) болушу мүмкүн.

Эмне кылдык

Биринчиден, так чекти сүрөттөп берүү керек болчу - кайсы убактан баштап биз кардарды кетти деп эсептей баштайбыз. Биздин иш үчүн маалыматтарды берген банктын көз карашы боюнча, кардардын иш абалы бинардык болгон - ал активдүү же жок. "Аракет" таблицасында ACTIVE_FLAG желеги бар болчу, анын мааниси "0" же "1" болушу мүмкүн (тиешелүүлүгүнө жараша "Активсиз" жана "Активдүү"). Ошондо баары жакшы болмок, бирок адам аны бир нече убакытка чейин активдүү колдонуп, анан бир ай бою активдүү тизмеден чыгып кете тургандай - ал ооруп калган, башка өлкөгө эс алууга кеткен, ал тургай тестирлөөгө барган. башка банктын картасы. Же, балким, узак убакыт бою аракетсиз болгондон кийин, банктын кызматтарын кайра колдоно баштаңыз

Ошондуктан, биз аракетсиздик мезгилин белгилүү бир үзгүлтүксүз мезгил деп атайлы деп чечтик, анын ичинде желек “0” деп коюлган.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Кардарлар ар кандай узактыктагы аракетсиздик мезгилинен кийин жигердүү эместен активдүүгө өтүшөт. Бизде "аракетсиздик мезгилинин ишенимдүүлүгү" эмпирикалык маанисинин даражасын эсептөө мүмкүнчүлүгү бар, башкача айтканда, адам убактылуу аракетсиздиктен кийин банк продуктуларын кайра колдоно башташы ыктымал.

Мисалы, бул график бир нече ай аракетсиздиктен кийин (ACTIVE_FLAG=1) кардарлардын активдүүлүгүн (ACTIVE_FLAG=0) калыбына келтирет.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Бул жерде биз иштей баштаган маалыматтар топтомун бир аз тактап беребиз. Ошентип, банк 19 ай үчүн топтолгон маалыматты төмөнкү таблицаларда берди:

  • «Активдүүлүк» - кардарлардын ай сайынкы транзакциялары (карталар боюнча, Интернет-банкингде жана мобилдик банкингде), анын ичинде эмгек акы жана жүгүртүү жөнүндө маалымат.
  • "Карталар" - деталдуу тарифтик графиги менен кардардын бардык карталары жөнүндө маалыматтар.
  • "Келишимдер" - кардардын келишимдери (ачык жана жабык): кредиттер, депозиттер ж.б.у.с., ар биринин параметрлерин көрсөтүү менен.
  • "Кардарлар" - демографиялык маалыматтардын жыйындысы (жынысы жана жашы) жана байланыш маалыматынын болушу.

Жумуш үчүн бизге “Картадан” башка бардык таблицалар керек болчу.

Бул жерде дагы бир кыйынчылык бар болчу - бул маалыматтарда банк карталарда кандай иш-аракеттер болгонун көрсөткөн эмес. Башкача айтканда, биз транзакциялар болгонбу же жокпу, түшүнө алганбыз, бирок алардын түрүн аныктай алган жокпуз. Ошондуктан, кардар накталай акча алып жатабы, айлык алып жатабы же акчаны сатып алууларга жумшап жатабы, белгисиз болчу. Бизде эсептин калдыктары боюнча маалыматтар да жок болчу, бул пайдалуу болмок.

Үлгү өзү калыс болду - бул бөлүмдө 19 ай ичинде банк кардарларды кармап калуу жана агылып чыгууну минималдаштыруу аракетин көргөн эмес.

Ошентип, аракетсиздик мезгили жөнүндө.

Кыймылдын аныктамасын түзүү үчүн аракетсиздик мезгилин тандоо керек. Убакыттын өтүшү менен прогнозду түзүү Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз, сиз интервал менен жок дегенде 3 ай кардар тарыхы болушу керек Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз. Тарыхыбыз 19 ай менен чектелип калгандыктан, эгер мүмкүн болсо, 6 ай аракетсиздик мөөнөтүн алууну чечтик. Ал эми жогорку сапаттагы болжолдоо үчүн минималдуу мезгил үчүн, биз 3 ай алды. Биз кардарлардын маалыматтарынын жүрүм-турумун талдоонун негизинде эмпирикалык түрдө 3 жана 6 ай үчүн цифраларды алдык.

Кырсыктын аныктамасын биз төмөнкүдөй формулировкаладык: кардардын айы Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз бул ACTIVE_FLAG=0 болгон биринчи ай, мында ушул айдан баштап ACTIVE_FLAG талаасында кеминде алты удаалаш нөл бар, башкача айтканда, кардар 6 ай бою жигердүү эмес болгон ай.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Кеткен кардарлардын саны

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Калган кардарлардын саны

Кыймыл кантип эсептелет?

Мындай мелдештерде, жалпысынан иш жүзүндө, агып чыгуу көбүнчө ушундай жол менен болжолдонот. Кардар өнүмдөрдү жана кызматтарды ар кандай мезгилдерде колдонот, аны менен өз ара аракеттенүү боюнча маалыматтар n белгиленген узундуктагы өзгөчөлүктөрдүн вектору катары көрсөтүлөт. Көбүнчө бул маалымат камтыйт:

  • Колдонуучуну мүнөздөгөн маалыматтар (демографиялык маалыматтар, маркетинг сегменти).
  • Банктык продуктыларды жана кызматтарды колдонуу тарыхы (бул кардарлардын аракеттери, алар ар дайым белгилүү бир убакытка же бизге керектүү интервалдын мезгилине байланган).
  • Тышкы маалыматтар, аны алуу мүмкүн болсо, - мисалы, коомдук тармактардан сын-пикирлер.

Ошондон кийин, алар ар бир тапшырма үчүн ар кандай chrn аныктамасын алышат. Андан кийин алар машинаны үйрөнүү алгоритмин колдонушат, ал кардардын кетүү ыктымалдыгын болжолдойт Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз факторлордун векторуна негизделген Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз. Алгоритмди үйрөтүү үчүн, чечим дарактарынын ансамблдерин куруу үчүн белгилүү рамкалардын бири колдонулат, XGBoost, LightGBM, CatBoost же алардын модификациялары.

Алгоритмдин өзү жаман эмес, бирок ал бузулууну алдын ала айтууда бир нече олуттуу кемчиликтерге ээ.

  • Анын "эс тутуму" жок.. Моделдин киргизүүсү - бул учурдагы убакытка туура келген функциялардын белгиленген саны. Параметрлердин өзгөрүү тарыхы жөнүндө маалыматты сактоо үчүн убакыттын өтүшү менен параметрлердин өзгөрүшүн мүнөздөгөн өзгөчө белгилерди, мисалы, акыркы 1,2,3, XNUMX, XNUMX айдагы банк операцияларынын санын же суммасын эсептөө зарыл. Бул ыкма убактылуу өзгөрүүлөрдүн мүнөзүн жарым-жартылай гана чагылдыра алат.
  • Туруктуу болжолдоо горизонту. Модель алдын ала аныкталган убакыт аралыгында, мисалы, бир ай мурун болжолдоону гана алдын ала айта алат. Эгерде прогноз башка убакытка, мисалы, үч айга талап кылынса, анда окуу топтомун кайра куруп, жаңы моделди кайра даярдоо керек.

Биздин мамиле

Биз дароо эле стандарттуу ыкмаларды колдонбойбуз деп чечтик. Чемпионатка бизден тышкары дагы 497 адам катталды, алардын ар биринин артында чоң тажрыйба бар. Андыктан мындай шарттарда стандарттуу схема боюнча бир нерсе жасоого аракет кылуу жакшы идея эмес.

Жана биз экилик классификация моделинин алдында турган көйгөйлөрдү кардарлардын иштен чыгуу убактысынын ыктымалдыгын бөлүштүрүүнү болжолдоо менен чече баштадык. Ушундай эле мамилени көрүүгө болот бул жерде, ал классикалык ыкмага караганда алда канча ийкемдүүрөөк алдын ала айтууга жана татаал гипотезаларды текшерүүгө мүмкүндүк берет. Агып кетүү убактысын моделдөөчү бөлүштүрүүчү үй-бүлө катары биз бөлүштүрүүнү тандадык Weibull жашоону талдоодо кеңири колдонулушу үчүн. Кардардын жүрүм-турумун жашоонун бир түрү катары кароого болот.

Бул жерде параметрлерге жараша Weibull ыктымалдык тыгыздык бөлүштүрүүнүн мисалдары келтирилген Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз и Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз:

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Бул үч түрдүү кардарлардын убакыттын өтүшү менен бузулушунун ыктымалдык тыгыздык функциясы. Убакыт айлар менен көрсөтүлөт. Башка сөз менен айтканда, бул график кардар кийинки эки айда качан иштебей калышы мүмкүн экенин көрсөтөт. Көрүнүп тургандай, дистрибуциялуу кардар Weibull(2, 0.5) жана Weibull кардарларына караганда эрте кетүү мүмкүнчүлүгүнө ээ. (3,1) бөлүштүрүү.

Натыйжада, ар бир кардар үчүн, ар бир үчүн үлгү болуп саналат
ай Weibull бөлүштүрүүнүн параметрлерин болжолдойт, ал убакыттын өтүшү менен агып кетүү ыктымалдыгынын пайда болушун эң жакшы чагылдырат. Кененирээк:

  • Тренинг топтомундагы максаттуу өзгөчөлүктөр - бул белгилүү бир кардар үчүн белгилүү бир айда иштен чыгууга чейин калган убакыт.
  • Эгерде кардар үчүн өчүрүү ылдамдыгы жок болсо, биз өчүрүү убактысы учурдагы айдан тартып бизде болгон тарыхтын аягына чейинки айлардын санынан көп деп ойлойбуз.
  • Колдонулган модель: LSTM катмары менен кайталануучу нейрондук тармак.
  • Жоготуу функциясы катары биз Weibull бөлүштүрүү үчүн терс логдук ыктымалдуулук функциясын колдонобуз.

Бул ыкманын артыкчылыктары:

  • Ыктымалдуулуктарды бөлүштүрүү, экилик классификациянын айкын мүмкүнчүлүгүнөн тышкары, ар кандай окуяларды ийкемдүү болжолдоого мүмкүндүк берет, мисалы, кардар 3 айдын ичинде банктын кызматтарын колдонууну токтотот. Ошондой эле, зарыл болсо, бул бөлүштүрүү боюнча ар кандай көрсөткүчтөрдү орточо болушу мүмкүн.
  • LSTM кайталануучу нейрон тармагы эс тутумуна ээ жана бардык жеткиликтүү тарыхты эффективдүү колдонот. Окуя кеңейтилген же такталган сайын, тактык жогорулайт.
  • Убакыт аралыгын кичинелерге бөлгөндө (мисалы, айларды жумаларга бөлгөндө) ыкманы оңой эле масштабдаштырса болот.

Бирок бул жакшы моделди түзүү үчүн жетиштүү эмес, ошондой эле анын сапатын туура баалоо керек.

Сапат кандай бааланды?

Биз метрика катары Lift Curve тандап алганбыз. Мындай учурларда бизнесте колдонулат, анткени анын так чечмелениши, ал жакшы сүрөттөлгөн бул жерде и бул жерде. Эгер сиз бул метриканын маанисин бир сүйлөм менен сүрөттөп берсеңиз, анда "Алгоритм биринчи жолу канча жолу эң жакшы божомолду жасайт Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз% кокусунан караганда."

Тренинг моделдери

Мелдештин шарттары ар кандай моделдерди жана ыкмаларды салыштырууга мүмкүн болгон конкреттүү сапат көрсөткүчүн белгилеген эмес. Мындан тышкары, бурмалоо аныктамасы ар кандай болушу мүмкүн жана өз кезегинде, бизнес максаттары менен аныкталат, көйгөйдү баяндоо көз каранды болушу мүмкүн. Ошондуктан, кайсы ыкма жакшыраак экенин түшүнүү үчүн биз эки моделди үйрөттүк:

  1. Ансамблдик чечим дарагынын машина үйрөнүү алгоритмин колдонуу менен кеңири колдонулган бинардык классификация ыкмасы (LightGBM);
  2. Weibull-LSTM модели

Сыноо топтому тренинг топтомунда жок 500 алдын ала тандалган кардарлардан турган. Кардар тарабынан бөлүнгөн кайчылаш валидацияны колдонуу менен модел үчүн гипер-параметрлер тандалып алынган. Ар бир моделди окутуу үчүн ошол эле функциялар топтому колдонулган.

Модель эстутумга ээ болбогондуктан, ал үчүн бир ай ичиндеги параметрлердин өзгөрүшүнүн акыркы үч айдагы параметрлер боюнча орточо мааниге катышын көрсөтүүчү атайын функциялар алынган. Акыркы үч айдын ичинде баалуулуктардын өзгөрүү темпи эмне менен мүнөздөлөт. Ансыз, Random Forest негизиндеги модель Weibull-LSTMге салыштырмалуу начар абалда болмок.

Эмне үчүн Weibull бөлүштүрүү менен LSTM ансамблдин чечим дарагынын мамилесинен жакшыраак

Бул жерде бир-эки эле сүрөттөрдө баары түшүнүктүү.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Классикалык алгоритм жана Weibull-LSTM үчүн Lift Curve салыштыруу

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Классикалык алгоритм жана Weibull-LSTM үчүн Lift Curve метрикасын ай боюнча салыштыруу

Жалпысынан алганда, LSTM дээрлик бардык учурларда классикалык алгоритмден жогору турат.

Чырдын божомолу

Weibull бөлүштүрүү менен LSTM клеткалары менен кайталануучу нейрондук тармакка негизделген модель, мисалы, кийинки n айдын ичинде кардарлардын бузулушун алдын ала болжолдой алат. n = 3 үчүн ишти карап көрөлү. Бул учурда, ар бир ай үчүн, нейрондук тармак кийинки айдан баштап жана n-айга чейин кардар кетээр-кетпесин туура аныкташы керек. Башка сөз менен айтканда, ал туура кардар n айдан кийин калаарын аныктоо керек. Бул алдын ала божомол катары каралышы мүмкүн: кардар жөн эле кетүү жөнүндө ойлоно баштаган учурду алдын ала айтуу.

Келгиле, Weibull-LSTM 1, 2 жана 3 айлар үчүн Lift Curve агып чыгууга чейин салыштырып көрөлү:

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Бир нече убакыттан бери активдүү болбой калган кардарлар үчүн жасалган прогноздор да маанилүү экенин жогоруда жазганбыз. Ошондуктан, бул жерде биз үлгүгө кеткен кардар буга чейин бир же эки ай бою жигердүү эмес болгон учурларды кошобуз жана Weibull-LSTM мындай учурларды туура эмес классификациялаганын текшеребиз. Мындай учурлар үлгүдө бар болгондуктан, биз тармак аларды жакшы чечет деп күтөбүз:

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Кардарларды кармоо

Чынында, бул мүмкүн болгон негизги нерсе, колунда мындай жана мындай кардарлар продуктуну колдонууну токтотууга даярданып жаткан маалымат бар. Кардарларды сактап калуу үчүн аларга пайдалуу бир нерсени сунуш кыла турган моделди куруу жөнүндө айтсак, эгер сизде жакшы аяктай турган окшош аракеттердин тарыхы болбосо, муну жасоо мүмкүн эмес.

Бизде андай окуя болгон эмес, ошондуктан биз аны ушундай чечтик.

  1. Биз ар бир кардар үчүн кызыктуу өнүмдөрдү аныктаган моделди куруп жатабыз.
  2. Ай сайын биз классификаторду иштетип, потенциалдуу кете турган кардарларды аныктайбыз.
  3. Биз кээ бир кардарларга 1-пункттун үлгүсүнө ылайык продуктуну сунуштайбыз жана биздин иш-аракеттерибизди эстейбиз.
  4. Бир нече айдан кийин биз бул мүмкүн болгон кардарлардын кимиси кетип, кайсынысы калганын карайбыз. Ошентип, биз окутуу үлгүсүн түзөт.
  5. 4-кадамда алынган тарыхты колдонуу менен моделди үйрөтөбүз.
  6. Каалоо боюнча, 1-кадамдагы моделди 5-кадамда алынган моделге алмаштырып, процедураны кайталайбыз.

Мындай сактоонун сапатын текшерүүнү кадимки A/B тестирлөө аркылуу жасоого болот - биз кете турган кардарларды эки топко бөлөбүз. Биз бирине сактоо моделибиздин негизинде өнүмдөрдү сунуштайбыз, ал эми экинчисине эч нерсе сунуштайбыз. Биз мисалдын 1-пунктунда пайдалуу боло турган моделди үйрөтүүнү чечтик.

Биз сегментацияны мүмкүн болушунча чечмеленүүчү кылгыбыз келди. Бул үчүн биз оңой чечмеленүүчү бир нече өзгөчөлүктөрдү тандап алдык: транзакциялардын жалпы саны, эмгек акы, эсептин жалпы жүгүртүүсү, жашы, жынысы. "Карталар" таблицасындагы өзгөчөлүктөр маалыматсыз катары эске алынган эмес, ал эми "Контракттар" 3-таблицадагы өзгөчөлүктөр валидациялоо топтому менен окутуу топтомунун ортосунда маалыматтардын агып кетишин болтурбоо үчүн кайра иштетүүнүн татаалдыгынан улам эске алынган эмес.

Кластерлөө Гаусс аралашмасынын моделдерин колдонуу менен жүргүзүлгөн. Akaike маалымат критерийи 2 оптиманы аныктоого мүмкүндүк берди. Биринчи оптимум 1 кластерге туура келет. Экинчи оптималдуу, азыраак, 80 кластерге туура келет. Бул жыйынтыкка таянып, биз төмөнкүдөй жыйынтык чыгарсак болот: априордук маалыматсыз маалыматтарды кластерлерге бөлүү өтө кыйын. Жакшыраак кластерлөө үчүн ар бир кардарды майда-чүйдөсүнө чейин сүрөттөгөн маалыматтар керек.

Ошондуктан, ар бир жеке кардарга ар кандай продуктуларды сунуштоо үчүн көзөмөлгө алынган окутуу маселеси каралды. «Мөөнөттүү депозит», «Кредиттик карта», «Овердрафт», «Керектөө насыясы», «Автокредит», «Ипотекалык кредит» товарлары каралды.

Маалыматтар продуктунун дагы бир түрүн камтыган: "Учурдагы эсеп". Бирок маалыматтын аздыгынан эске алган жокпуз. Банк кардарлары болгон колдонуучулар үчүн, б.а. анын өнүмдөрүн колдонууну токтоткон жок, кайсы продукт аларды кызыктыра аларын алдын ала айтуу үчүн модель курулган. Модель катары логистикалык регрессия тандалды, ал эми сапатты баалоо көрсөткүчү катары биринчи 10 пайыздык үчүн Lift мааниси колдонулган.

моделдин сапатын сүрөттө баалоого болот.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз
Кардарлар үчүн продукт сунуш моделинин натыйжалары

жыйынтык

Бул ыкма бизге RAIF-Challenge 2017 AI чемпионатында "Банктарда AI" категориясында биринчи орунду алып келди.

Табигый кырсык сыяктуу жакындап, кыйроону алдын ала айтканбыз

Сыягы, негизги нерсе көйгөйгө адаттан тыш бурчтан мамиле кылуу жана адатта башка кырдаалдар үчүн колдонулган ыкманы колдонуу болду.

Колдонуучулардын массалык агылып кетиши кызматтар үчүн табигый кырсык болушу мүмкүн.

Бул ыкма жөн гана банктар эмес, сыртка агып чыгууну эске алуу маанилүү болгон башка аймактар ​​үчүн да эске алынышы мүмкүн. Мисалы, биз аны өзүбүздүн агымды эсептеп чыгуу үчүн колдондук - Ростелекомдун Сибирь жана Санкт-Петербург филиалдарында.

«Маалыматтарды казып алуу лабораториясы» компаниясы «Спутник» издөө порталы

Source: www.habr.com

Комментарий кошуу