Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Usahay, aron masulbad ang usa ka problema, kinahanglan nimo nga tan-awon kini sa lahi nga anggulo. Bisan kung sa miaging 10 ka tuig ang parehas nga mga problema nasulbad sa parehas nga paagi nga adunay lainlaing mga epekto, dili usa ka kamatuoran nga kini nga pamaagi mao ra.

Adunay ingon nga usa ka hilisgutan sama sa customer churn. Ang butang dili kalikayan, tungod kay ang mga kostumer sa bisan unsang kompanya mahimo, sa daghang mga hinungdan, mohunong sa paggamit sa mga produkto o serbisyo niini. Siyempre, alang sa usa ka kompanya, ang churn usa ka natural, apan dili ang labing gitinguha nga aksyon, mao nga ang tanan naningkamot nga maminusan kini nga churn. Mas maayo pa, matagna ang kalagmitan sa churn alang sa usa ka partikular nga kategorya sa mga tiggamit, o usa ka piho nga tiggamit, ug isugyot ang pipila ka mga lakang aron mapadayon sila.

Kinahanglan nga analisahon ug paningkamutan nga ipadayon ang kliyente, kung mahimo, sa labing menos sa mosunod nga mga hinungdan:

  • Ang pagdani sa bag-ong mga kustomer mas mahal kaysa mga pamaagi sa pagpadayon. Aron madani ang mga bag-ong kostumer, ingon nga usa ka lagda, kinahanglan ka nga mogasto og pipila ka salapi (advertising), samtang ang kasamtangan nga mga kustomer mahimong ma-activate sa usa ka espesyal nga tanyag nga adunay espesyal nga mga kondisyon;
  • Ang pagsabut sa mga hinungdan ngano nga ang mga kustomer mobiya mao ang yawi sa pagpaayo sa mga produkto ug serbisyo.

Adunay mga sumbanan nga pamaagi sa pagtagna sa churn. Apan sa usa sa mga kampeonato sa AI, nakahukom kami nga sulayan ang pag-apod-apod sa Weibull alang niini. Kini kasagarang gigamit alang sa survivability analysis, weather forecasting, natural disaster analysis, industrial engineering ug uban pa. Ang pag-apod-apod sa Weibull usa ka espesyal nga function sa pag-apod-apod nga gi-parameter sa duha nga mga parameter Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman ΠΈ Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman.

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Wikipedia

Sa kinatibuk-an, kini usa ka makapaikag nga butang, apan alang sa pagtagna sa mga pag-agos, ug sa fintech sa kinatibuk-an, dili kini kanunay nga gigamit. Ubos sa pagputol among isulti kanimo kung giunsa namo (Data Mining Laboratory) kini gibuhat, dungan nga nakadaog og bulawan sa Artificial Intelligence Championship sa kategoryang "AI sa mga Bangko".

Mahitungod sa churn sa kinatibuk-an

Atong sabton og gamay kung unsa ang customer churn ug nganong importante kaayo kini. Ang base sa kustomer hinungdanon alang sa usa ka negosyo. Ang mga bag-ong kustomer moabut sa kini nga base, pananglitan, nahibal-an ang bahin sa usa ka produkto o serbisyo gikan sa usa ka paanunsyo, mabuhi sa pila ka oras (aktibo nga gigamit ang mga produkto) ug pagkahuman sa pila ka oras hunong sa paggamit niini. Kini nga panahon gitawag nga "Customer Lifecycle" - usa ka termino nga naghulagway sa mga yugto nga maagian sa usa ka kustomer kung nahibal-an niya ang bahin sa usa ka produkto, naghimo usa ka desisyon sa pagpalit, nagbayad, gigamit ug nahimo nga maunongon nga konsumedor, ug sa katapusan mihunong sa paggamit sa produkto. sa usa ka rason o sa lain. Tungod niini, ang churn mao ang katapusang yugto sa siklo sa kinabuhi sa kliyente, kung ang kliyente mohunong sa paggamit sa mga serbisyo, ug alang sa usa ka negosyo kini nagpasabut nga ang kliyente mihunong sa pagdala sa ganansya o bisan unsang kaayohan.

Ang matag kliyente sa bangko usa ka espesipikong tawo nga mopili sa usa o lain nga bank card espesipiko alang sa iyang mga panginahanglan. Kung kanunay ka nga magbiyahe, usa ka kard nga adunay mga milya ang magamit. Nagpalit ug daghan - hello, cashback card. Daghan siya nga gipalit sa piho nga mga tindahan - ug adunay usa ka espesyal nga kauban nga plastik alang niini. Siyempre, usahay ang usa ka kard gipili base sa sukdanan sa "Pinakamabarato nga serbisyo". Sa kinatibuk-an, adunay igo nga mga variable dinhi.

Ug gipili usab sa usa ka tawo ang bangko mismo - aduna bay punto sa pagpili sa usa ka kard gikan sa usa ka bangko kansang mga sanga anaa lamang sa Moscow ug sa rehiyon, kung gikan ka sa Khabarovsk? Bisan kung ang usa ka kard gikan sa ingon nga bangko labing menos 2 ka beses nga labi ka mapuslanon, ang presensya sa mga sanga sa bangko sa duol usa gihapon ka hinungdanon nga sukdanan. Oo, ania na ang 2019 ug ang digital mao ang tanan, apan daghang mga isyu sa pipila nga mga bangko masulbad ra sa usa ka sanga. Dugang pa, usab, ang pipila ka bahin sa populasyon nagsalig sa usa ka pisikal nga bangko labi pa sa usa ka aplikasyon sa usa ka smartphone, kinahanglan usab kini nga tagdon.

Ingon usa ka sangputanan, ang usa ka tawo mahimong adunay daghang mga hinungdan sa pagdumili sa mga produkto sa bangko (o ang bangko mismo). Nag-ilis kog trabaho, ug ang taripa sa kard nausab gikan sa suweldo ngadto sa β€œPara sa mga mortal,” nga dili kaayo kita. Mibalhin ko sa laing siyudad diin walay mga sanga sa bangko. Dili ko ganahan sa interaksyon sa dili kwalipikado nga operator sa branch. Kana mao, mahimo nga adunay daghang mga hinungdan sa pagsira sa usa ka account kaysa sa paggamit sa produkto.

Ug ang kliyente dili lamang tin-aw nga makapahayag sa iyang tuyo - adto sa bangko ug magsulat og usa ka pahayag, apan hunongon lang ang paggamit sa mga produkto nga walay pagtapos sa kontrata. Nakahukom nga gamiton ang pagkat-on sa makina ug AI aron masabtan ang ingon nga mga problema.

Dugang pa, ang customer churn mahimong mahitabo sa bisan unsang industriya (telecom, Internet providers, kompanya sa seguro, sa kinatibuk-an, bisan asa adunay base sa kostumer ug mga regular nga transaksyon).

Unsa may among nabuhat

Una sa tanan, gikinahanglan nga ihulagway ang usa ka tin-aw nga utlanan - gikan sa unsang orasa magsugod kami sa paghunahuna nga ang kliyente mibiya. Gikan sa punto sa panglantaw sa bangko nga naghatag kanamo sa datos alang sa among trabaho, ang kahimtang sa kalihokan sa kliyente binary - siya aktibo o dili. Adunay ACTIVE_FLAG nga bandera sa "Activity" nga lamesa, ang bili niini mahimong "0" o "1" ("Inactive" ug "Active" matag usa). Ug ang tanan mamaayo ra, apan ang usa ka tawo ingon nga mahimo niya nga aktibo nga magamit kini sa pipila ka mga panahon, ug unya mahulog gikan sa aktibo nga lista sulod sa usa ka bulan - nasakit siya, miadto sa laing nasud nga nagbakasyon, o bisan miadto sa pagsulay sa usa ka card gikan sa laing bangko. O tingali human sa taas nga panahon sa pagkadili aktibo, magsugod sa paggamit sa mga serbisyo sa bangko pag-usab

Busa, nakahukom kami nga tawagan ang usa ka panahon sa pagkadili aktibo sa usa ka piho nga padayon nga yugto sa panahon diin ang bandila alang niini gibutang sa "0".

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Ang mga kliyente mobalhin gikan sa dili aktibo ngadto sa aktibo human sa mga panahon sa pagkadili aktibo sa lain-laing mga gitas-on. Kami adunay oportunidad sa pagkalkulo sa ang-ang sa empirical nga bili "kasaligan sa mga panahon sa pagkadili aktibo" - nga mao, ang kalagmitan nga ang usa ka tawo magsugod sa paggamit sa mga produkto sa bangko pag-usab human sa temporaryo nga pagkadili aktibo.

Pananglitan, kini nga graph nagpakita sa pagpadayon sa kalihokan (ACTIVE_FLAG=1) sa mga kliyente human sa pipila ka bulan nga walay kalihokan (ACTIVE_FLAG=0).

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Dinhi among ipatin-aw gamay ang set sa datos diin kami nagsugod sa pagtrabaho. Busa, ang bangko naghatag ug aggregated nga impormasyon sulod sa 19 ka bulan sa mosunod nga mga talaan:

  • "Kalihokan" - binulan nga mga transaksyon sa kustomer (pinaagi sa mga kard, sa Internet banking ug mobile banking), lakip ang payroll ug impormasyon sa turnover.
  • "Mga Card" - datos bahin sa tanan nga mga kard nga naa sa kliyente, nga adunay detalyado nga iskedyul sa taripa.
  • "Mga Kasabutan" - kasayuran bahin sa mga kasabutan sa kliyente (parehong bukas ug sirado): mga pautang, deposito, ug uban pa, nga nagpakita sa mga parameter sa matag usa.
  • "Mga Kustomer" - usa ka hugpong sa datos sa demograpiko (kasarian ug edad) ug ang pagkaanaa sa impormasyon sa pagkontak.

Alang sa trabaho kinahanglan namon ang tanan nga mga lamesa gawas sa "Mapa".

Adunay lain nga kalisud dinhi - sa kini nga datos wala gipakita sa bangko kung unsang klase nga kalihokan ang nahitabo sa mga kard. Sa ato pa, masabtan nato kon duna bay mga transaksyon o wala, apan dili na nato madeterminar ang ilang matang. Busa, dili klaro kung ang kliyente nag-withdraw og kwarta, nakadawat og suweldo, o naggasto sa kwarta sa mga gipamalit. Wala usab kami mga datos sa mga balanse sa account, nga magamit unta.

Ang sample mismo walay bias - sa niini nga sample, sa 19 ka bulan, ang bangko wala mohimo sa bisan unsa nga pagsulay sa pagpabilin sa mga kustomer ug mamenosan ang outflow.

Busa, mahitungod sa mga panahon sa pagkadili aktibo.

Aron maporma ang usa ka kahulugan sa churn, kinahanglan nga pilion ang usa ka panahon sa pagkadili aktibo. Aron makahimo usa ka churn forecast sa usa ka punto sa oras Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman, kinahanglan nga adunay ka kasaysayan sa kustomer nga labing menos 3 ka bulan sa usa ka agwat Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman. Limitado ang among kasaysayan sa 19 ka bulan, mao nga nakahukom kami nga magdugay nga dili aktibo nga 6 ka bulan, kung magamit. Ug alang sa minimum nga panahon alang sa usa ka taas nga kalidad nga forecast, mikuha kami og 3 ka bulan. Gikuha namon ang mga numero alang sa 3 ug 6 nga mga bulan nga empirically base sa usa ka pagtuki sa pamatasan sa datos sa kostumer.

Giporma namo ang kahulugan sa churn sama sa mosunod: month of customer churn Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman kini ang unang bulan nga adunay ACTIVE_FLAG=0, diin gikan niining bulana adunay labing menos unom ka sunod-sunod nga mga sero sa ACTIVE_FLAG natad, sa laing pagkasulti, ang bulan diin ang kliyente dili aktibo sulod sa 6 ka bulan.

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Gidaghanon sa mga kliyente nga mibiya

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Gidaghanon sa nahabilin nga mga kliyente

Giunsa pagkalkulo ang churn?

Sa ingon nga mga kompetisyon, ug sa praktis sa kinatibuk-an, ang outflow kanunay nga gitagna sa niini nga paagi. Ang kliyente naggamit sa mga produkto ug serbisyo sa lainlaing mga yugto sa panahon, ang datos sa pakig-uban kaniya girepresentahan ingon usa ka vector sa mga bahin sa usa ka piho nga gitas-on n. Kasagaran kini nga kasayuran naglakip sa:

  • Ang datos nga nagpaila sa tiggamit (demographic data, bahin sa marketing).
  • Kasaysayan sa paggamit sa mga produkto ug serbisyo sa banking (kini ang mga aksyon sa kostumer nga kanunay gihigot sa usa ka piho nga oras o yugto sa agwat nga kinahanglan namon).
  • Ang gawas nga datos, kung posible nga makuha kini - pananglitan, mga pagsusi gikan sa mga social network.

Ug pagkahuman niana, nakakuha sila usa ka kahulugan sa churn, lahi sa matag buluhaton. Unya naggamit sila usa ka algorithm sa pagkat-on sa makina, nga nagtagna sa posibilidad nga mobiya ang usa ka kliyente Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman base sa usa ka vector sa mga hinungdan Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman. Aron mabansay ang algorithm, usa sa mga bantog nga balangkas alang sa pagtukod sa mga ensemble sa mga punoan sa desisyon gigamit, XGBoost, KahayagGBM, CatBoost o mga kausaban niini.

Ang algorithm mismo dili daotan, apan kini adunay daghang mga seryoso nga disbentaha kung bahin sa pagtagna sa churn.

  • Wala siyay gitawag nga "memorya". Ang input sa modelo usa ka piho nga gidaghanon sa mga bahin nga katumbas sa karon nga punto sa oras. Aron matipigan ang kasayuran bahin sa kasaysayan sa mga pagbag-o sa mga parameter, kinahanglan nga kuwentahon ang mga espesyal nga bahin nga nagpaila sa mga pagbag-o sa mga parameter sa paglabay sa panahon, pananglitan, ang gidaghanon o kantidad sa mga transaksyon sa bangko sa miaging 1,2,3, XNUMX, XNUMX ka bulan. Kini nga pamaagi mahimo lamang nga partially magpakita sa kinaiyahan sa temporaryo nga mga pagbag-o.
  • Naayo nga kapunawpunawan sa forecast. Ang modelo makahimo lamang sa pagtagna sa customer churn alang sa usa ka predefined nga yugto sa panahon, pananglitan, usa ka forecast usa ka bulan nga abante. Kung ang usa ka forecast gikinahanglan alang sa usa ka lahi nga yugto sa panahon, pananglitan, tulo ka bulan, nan kinahanglan nimo nga tukuron pag-usab ang set sa pagbansay ug magbansay pag-usab sa usa ka bag-ong modelo.

Atong approach

Nakahukom mi dayon nga dili mi mogamit ug standard approaches. Dugang sa amon, 497 pa nga mga tawo ang nagparehistro sa kampeonato, nga ang matag usa adunay daghang kasinatian sa luyo nila. Mao nga ang pagsulay sa pagbuhat sa usa ka butang sumala sa usa ka sumbanan nga laraw sa ingon nga mga kahimtang dili maayo nga ideya.

Ug nagsugod kami sa pagsulbad sa mga problema nga giatubang sa binary classification model pinaagi sa pagtagna sa kalagmitan sa pag-apod-apod sa mga panahon sa pag-churn sa kustomer. Ang susamang paagi makita dinhi, kini nagtugot kanimo sa pagtagna sa churn nga mas flexible ug pagsulay sa mas komplikado nga mga pangagpas kaysa sa klasikal nga pamaagi. Ingon usa ka pamilya sa mga pag-apod-apod nga nagmodelo sa oras sa pag-agos, gipili namon ang pag-apod-apod Weibull alang sa kaylap nga paggamit niini sa pagtuki sa survival. Ang pamatasan sa kliyente mahimong tan-awon nga usa ka matang sa pagkaluwas.

Ania ang mga pananglitan sa Weibull probability density distributions depende sa parameters Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman ΠΈ Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman:

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Kini ang posibilidad nga densidad function sa tulo ka lain-laing mga kustomer churn sa paglabay sa panahon. Ang oras gipresentar sa mga bulan. Sa laing pagkasulti, kini nga graph nagpakita kung kanus-a ang usa ka kliyente lagmit nga mag-churn sa sunod nga duha ka bulan. Sama sa imong makita, ang usa ka kliyente nga adunay usa ka distribusyon adunay mas dako nga potensyal nga mobiya sa sayo pa kaysa sa mga kliyente nga adunay Weibull(2, 0.5) ug Weibull (3,1) mga apod-apod.

Ang resulta usa ka modelo nga, alang sa matag kliyente, alang sa matag
bulan nagtagna sa mga parametro sa Weibull distribution, nga labing maayo nga nagpakita sa panghitabo sa kalagmitan sa outflow sa paglabay sa panahon. Sa dugang nga detalye:

  • Ang mga target nga bahin sa set sa pagbansay mao ang nahabilin nga oras hangtod sa pag-churn sa usa ka piho nga bulan para sa usa ka piho nga kliyente.
  • Kung walay rate sa churn alang sa usa ka kustomer, atong hunahunaon nga ang oras sa churn mas dako kaysa sa gidaghanon sa mga bulan gikan sa karon nga bulan hangtod sa katapusan sa kasaysayan nga naa kanato.
  • Gigamit nga modelo: balik-balik nga neural network nga adunay LSTM layer.
  • Isip usa ka function sa pagkawala, among gigamit ang negatibo nga log-likelihood function alang sa Weibull distribution.

Ania ang mga bentaha niini nga pamaagi:

  • Ang pag-apod-apod sa kalagmitan, dugang sa klaro nga posibilidad sa binary nga klasipikasyon, nagtugot sa flexible nga panagna sa lainlaing mga panghitabo, pananglitan, kung ang usa ka kliyente mohunong sa paggamit sa mga serbisyo sa bangko sulod sa 3 ka bulan. Usab, kung kinahanglan, ang lainlaing mga sukatan mahimong ma-average sa kini nga pag-apod-apod.
  • Ang LSTM nagbalikbalik nga neural network adunay memorya ug epektibo nga gigamit ang tibuuk nga magamit nga kasaysayan. Samtang ang istorya gipalapdan o gipino, ang katukma nagdugang.
  • Ang pamaagi dali nga ma-scale kung gibahin ang mga yugto sa panahon ngadto sa gagmay (pananglitan, kung gibahin ang mga bulan sa mga semana).

Apan dili igo ang paghimo og usa ka maayo nga modelo; kinahanglan usab nimo nga husto ang pagtimbang-timbang sa kalidad niini.

Giunsa pagtantiya ang kalidad?

Gipili namo ang Lift Curve isip metric. Gigamit kini sa negosyo alang sa ingon nga mga kaso tungod sa tin-aw nga paghubad niini, kini maayo nga gihulagway dinhi ΠΈ dinhi. Kung imong ihulagway ang kahulugan niini nga metric sa usa ka sentence, kini mahimong "Pila ka beses nga ang algorithm naghimo sa labing maayo nga panagna sa una Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman% kay sa random."

Mga modelo sa pagbansay

Ang mga kondisyon sa kompetisyon wala magtukod usa ka piho nga sukatan sa kalidad diin ang lainlaing mga modelo ug pamaagi mahimong itandi. Dugang pa, ang kahulugan sa churn mahimong lahi ug mahimong magdepende sa pahayag sa problema, nga, sa baylo, gitino sa mga katuyoan sa negosyo. Busa, aron masabtan kung unsang pamaagi ang mas maayo, gibansay namo ang duha ka mga modelo:

  1. Usa ka kasagarang gigamit nga binary classification approach gamit ang ensemble decision tree machine learning algorithm (KahayagGBM);
  2. Weibull-LSTM nga modelo

Ang set sa pagsulay naglangkob sa 500 nga gipili nga mga kliyente nga wala sa set sa pagbansay. Ang mga hyper-parameter gipili alang sa modelo gamit ang cross-validation, gibungkag sa kliyente. Ang parehas nga hugpong sa mga bahin gigamit sa pagbansay sa matag modelo.

Tungod sa kamatuoran nga ang modelo walay panumduman, ang mga espesyal nga bahin gikuha alang niini, nga nagpakita sa ratio sa mga pagbag-o sa mga parameter sulod sa usa ka bulan ngadto sa kasagaran nga bili alang sa mga parameter sa miaging tulo ka bulan. Unsa ang nagpaila sa rate sa pagbag-o sa mga kantidad sa katapusang yugto sa tulo ka bulan. Kung wala kini, ang modelo nga nakabase sa Random Forest mahimong usa ka disbentaha sa Weibull-LSTM.

Ngano nga ang LSTM nga adunay Weibull distribution mas maayo kaysa usa ka ensemble decision tree nga pamaagi

Ang tanan klaro dinhi sa usa ka pares nga mga litrato.

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Pagtandi sa Lift Curve alang sa classical algorithm ug Weibull-LSTM

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Pagtandi sa Lift Curve metric sa bulan para sa classical algorithm ug Weibull-LSTM

Sa kinatibuk-an, ang LSTM labaw sa klasikal nga algorithm sa halos tanan nga mga kaso.

Pagtagna sa Churn

Ang usa ka modelo nga gibase sa usa ka balik-balik nga neural network nga adunay LSTM nga mga selyula nga adunay Weibull nga pag-apod-apod mahimong makatagna sa churn nga abante, pananglitan, pagtagna sa customer churn sulod sa sunod nga n nga mga bulan. Tagda ang kaso alang sa n = 3. Sa kini nga kaso, alang sa matag bulan, ang neural network kinahanglan nga husto nga mahibal-an kung ang kliyente mobiya, sugod sa sunod nga bulan ug hangtod sa ikasiyam nga bulan. Sa laing pagkasulti, kinahanglan nga husto nga mahibal-an kung ang kustomer magpabilin pagkahuman sa n nga mga bulan. Mahimo kini isipon nga usa ka forecast nga abante: pagtagna sa higayon nga ang kliyente nagsugod pa lang sa paghunahuna mahitungod sa pagbiya.

Atong itandi ang Lift Curve para sa Weibull-LSTM 1, 2 ug 3 ka bulan sa wala pa ang outflow:

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Gisulat na namo sa ibabaw nga ang mga panagna nga gihimo alang sa mga kliyente nga dili na aktibo sulod sa pipila ka panahon importante usab. Busa, dinhi atong idugang sa sample ang maong mga kaso kung ang mitaliwan nga kustomer wala na aktibo sulod sa usa o duha ka bulan, ug susiha nga ang Weibull-LSTM husto nga nagklasipikar sa maong mga kaso isip churn. Tungod kay ang ingon nga mga kaso naa sa sample, gipaabut namon nga maayo ang pagdumala sa network:

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Pagpabilin sa kustomer

Sa tinuud, kini ang panguna nga butang nga mahimo, nga adunay kasayuran sa kamot nga ang ingon ug ingon nga mga kliyente nangandam sa paghunong sa paggamit sa produkto. Naghisgot bahin sa paghimo og usa ka modelo nga makahatag usa ka butang nga mapuslanon sa mga kustomer aron mapadayon sila, dili kini mahimo kung wala ka usa ka kasaysayan sa parehas nga mga pagsulay nga matapos nga maayo.

Wala kami'y ingon nga istorya, mao nga nakahukom kami niini nga paagi.

  1. Nagtukod kami usa ka modelo nga nagpaila sa makapaikag nga mga produkto alang sa matag kliyente.
  2. Kada bulan among gipadagan ang classifier ug giila ang posibleng mobiya sa mga kustomer.
  3. Gitanyag namon ang pipila ka mga kliyente sa produkto, sumala sa modelo gikan sa punto 1, ug hinumdomi ang among mga aksyon.
  4. Paglabay sa pipila ka bulan, among gitan-aw kung kinsa niining mga kliyente nga posibleng mobiya ug kung kinsa ang nagpabilin. Sa ingon, naghimo kami usa ka sample sa pagbansay.
  5. Gibansay namo ang modelo gamit ang kasaysayan nga nakuha sa lakang 4.
  6. Opsyonal, gisubli namon ang pamaagi, gipulihan ang modelo gikan sa lakang 1 sa modelo nga nakuha sa lakang 5.

Ang usa ka pagsulay sa kalidad sa ingon nga pagpadayon mahimo pinaagi sa regular nga pagsulay sa A/B - gibahin namon ang mga kostumer nga mahimo’g mobiya sa duha ka grupo. Nagtanyag kami og mga produkto ngadto sa usa base sa among retensyon nga modelo, ug sa lain wala kami magtanyag. Nakahukom kami sa pagbansay sa usa ka modelo nga mahimong mapuslanon na sa punto 1 sa among panig-ingnan.

Gusto namong himoon ang segmentation nga mahubad kutob sa mahimo. Aron mahimo kini, gipili namon ang daghang mga bahin nga dali mahubad: ang kinatibuk-ang gidaghanon sa mga transaksyon, sweldo, kinatibuk-ang turnover sa account, edad, gender. Ang mga bahin gikan sa lamesa nga "Maps" wala gikonsiderar nga dili kasayuran, ug ang mga bahin gikan sa lamesa 3 "Mga Kontrata" wala gikonsiderar tungod sa pagkakomplikado sa pagproseso aron malikayan ang pagtagas sa datos tali sa set sa validation ug set sa pagbansay.

Ang clustering gihimo gamit ang Gaussian mixture models. Ang Akaike information criterion nagtugot kanamo sa pagtino sa 2 optima. Ang una nga kamalaumon katumbas sa 1 cluster. Ang ikaduha nga labing kaayo, dili kaayo gipahayag, katumbas sa 80 nga mga pungpong. Base niini nga resulta, mahimo natong makuha ang mosunod nga konklusyon: lisud kaayo ang pagbahin sa datos ngadto sa mga cluster nga walay priori nga gihatag nga impormasyon. Para sa mas maayo nga clustering, kinahanglan nimo ang datos nga naghulagway sa matag kliyente sa detalye.

Busa, ang problema sa pagdumala sa pagkat-on gikonsiderar aron sa pagtanyag sa matag indibidwal nga kliyente og lahi nga produkto. Ang mosunod nga mga produkto gikonsiderar: "Term deposit", "Credit card", "Overdraft", "Consumer loan", "Car loan", "Mortgage".

Ang datos naglakip sa usa pa ka matang sa produkto: "Karon nga account". Apan wala namo kini tagda tungod sa ubos nga sulod sa impormasyon niini. Alang sa mga tiggamit nga kliyente sa bangko, i.e. wala mohunong sa paggamit sa mga produkto niini, usa ka modelo ang gihimo aron matagna kung unsang produkto ang mahimong interesado kanila. Ang logistic regression gipili isip modelo, ug ang Lift value para sa unang 10 percentiles gigamit isip quality assessment metric.

Ang kalidad sa modelo mahimong masusi sa numero.

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman
Mga resulta sa modelo sa rekomendasyon sa produkto alang sa mga kustomer

Ang resulta

Kini nga pamaagi nagdala kanamo una nga lugar sa kategorya nga "AI sa mga Bangko" sa RAIF-Challenge 2017 AI Championship.

Giunsa namo gitagna ang churn pinaagi sa pagduol niini sama sa usa ka natural nga katalagman

Dayag, ang panguna nga butang mao ang pagduol sa problema gikan sa usa ka dili kinaandan nga anggulo ug paggamit usa ka pamaagi nga sagad gigamit alang sa ubang mga sitwasyon.

Bisan kung ang usa ka dako nga pag-agos sa mga tiggamit mahimo’g usa ka natural nga katalagman alang sa mga serbisyo.

Kini nga pamaagi mahimong tagdon alang sa bisan unsang ubang lugar diin hinungdanon nga tagdon ang outflow, dili lamang mga bangko. Pananglitan, gigamit namo kini sa pagkalkulo sa among kaugalingong outflow - sa Siberian ug St. Petersburg nga mga sanga sa Rostelecom.

"Data Mining Laboratory" kompanya nga "Pagpangita portal "Sputnik"

Source: www.habr.com

Idugang sa usa ka comment