ProHoster > KÄ mÄs paredzÄjÄm sabrukumu, tuvojoties tai kÄ dabas katastrofai
KÄ mÄs paredzÄjÄm sabrukumu, tuvojoties tai kÄ dabas katastrofai
Dažreiz, lai atrisinÄtu problÄmu, jums vienkÄrÅ”i jÄpaskatÄs uz to no cita leÅÄ·a. Pat ja pÄdÄjo 10 gadu laikÄ lÄ«dzÄ«gas problÄmas ir atrisinÄtas vienÄdi ar dažÄdiem efektiem, tas nav fakts, ka Ŕī metode ir vienÄ«gÄ.
Ir tÄda tÄma kÄ klientu atturÄÅ”anÄs. Lieta ir neizbÄgama, jo jebkura uzÅÄmuma klienti daudzu iemeslu dÄļ var pÄrtraukt lietot tÄ produktus vai pakalpojumus. Protams, uzÅÄmumam kaulÄÅ”anÄs ir dabiska, bet ne pati vÄlamÄkÄ darbÄ«ba, tÄpÄc katrs cenÅ”as Å”o slogu samazinÄt lÄ«dz minimumam. VÄl labÄk, prognozÄjiet atteikÅ”anÄs iespÄjamÄ«bu noteiktai lietotÄju kategorijai vai konkrÄtam lietotÄjam un iesakiet dažas darbÄ«bas, lai tos saglabÄtu.
Ir nepiecieÅ”ams analizÄt un mÄÄ£inÄt noturÄt klientu, ja iespÄjams, vismaz Å”Ädu iemeslu dÄļ:
jaunu klientu piesaiste ir dÄrgÄka nekÄ saglabÄÅ”anas procedÅ«ras. Lai piesaistÄ«tu jaunus klientus, parasti ir jÄiztÄrÄ nauda (reklÄma), savukÄrt esoÅ”os klientus var aktivizÄt ar Ä«paÅ”u piedÄvÄjumu ar Ä«paÅ”iem nosacÄ«jumiem;
Izpratne par iemesliem, kÄpÄc klienti aiziet, ir produktu un pakalpojumu uzlaboÅ”anas atslÄga.
Ir standarta pieejas, lai prognozÄtu atteikÅ”anos. Bet vienÄ no AI ÄempionÄtiem mÄs nolÄmÄm izmÄÄ£inÄt Weibull izplatÄ«Å”anu Å”im nolÅ«kam. To visbiežÄk izmanto izdzÄ«voÅ”anas analÄ«zei, laika prognozÄÅ”anai, dabas katastrofu analÄ«zei, rÅ«pnieciskajai inženierijai un tamlÄ«dzÄ«giem nolÅ«kiem. Veibula sadalÄ«jums ir Ä«paÅ”a sadalÄ«juma funkcija, ko parametrizÄ divi parametri Šø .
Wikipedia
KopumÄ tÄ ir interesanta lieta, taÄu aizplÅ«Å”anas prognozÄÅ”anai un fintech vispÄr to neizmanto tik bieži. Zem griezuma mÄs pastÄstÄ«sim, kÄ mÄs (Datu ieguves laboratorija) to izdarÄ«jÄm, vienlaikus izcÄ«not zeltu MÄkslÄ«gÄ intelekta ÄempionÄtÄ kategorijÄ āAI bankÄsā.
Par churn vispÄr
Mazliet sapratÄ«sim, kas ir klientu atteikÅ”anÄs un kÄpÄc tas ir tik svarÄ«gi. Klientu bÄze ir svarÄ«ga uzÅÄmumam. Å ajÄ bÄzÄ nonÄk jauni klienti, piemÄram, uzzinÄjuÅ”i par kÄdu preci vai pakalpojumu no sludinÄjuma, kÄdu laiku dzÄ«vo (aktÄ«vi lieto preces) un pÄc kÄda laika pÄrtrauc to lietot. Å o periodu sauc par āKlienta dzÄ«ves cikluā ā termins, kas apraksta posmus, ko klients iziet, kad viÅÅ” uzzina par produktu, pieÅem lÄmumu par pirkumu, maksÄ, lieto un kļūst par lojÄlu patÄrÄtÄju un galu galÄ pÄrtrauc produkta lietoÅ”anu. viena vai otra iemesla dÄļ. AttiecÄ«gi churn ir klienta dzÄ«ves cikla pÄdÄjais posms, kad klients pÄrtrauc izmantot pakalpojumus, un uzÅÄmumam tas nozÄ«mÄ, ka klients vairs nenes peļÅu vai vispÄr ir pÄrstÄjis nest labumu.
Katrs bankas klients ir konkrÄta persona, kura izvÄlas vienu vai otru bankas karti tieÅ”i savÄm vajadzÄ«bÄm. Ja ceļojat bieži, noderÄs karte ar jÅ«dzÄm. PÄrk daudz - sveiki, naudas atmaksas karte. ViÅÅ” daudz pÄrk konkrÄtos veikalos - un tam jau ir Ä«paÅ”a partnera plastmasa. Protams, dažreiz karte tiek izvÄlÄta pÄc kritÄrija āLÄtÄkais pakalpojumsā. KopumÄ Å”eit ir pietiekami daudz mainÄ«go.
Un cilvÄks izvÄlas arÄ« paÅ”u banku - kÄda jÄga izvÄlÄties karti no bankas, kuras filiÄles ir tikai MaskavÄ un reÄ£ionÄ, kad esat no Habarovskas? Pat ja karte no Å”Ädas bankas ir vismaz 2 reizes izdevÄ«gÄka, bankas filiÄļu klÄtbÅ«tne tuvumÄ joprojÄm ir svarÄ«gs kritÄrijs. JÄ, 2019. gads jau ir klÄt, un digitÄlais mums ir viss, taÄu vairÄkas problÄmas ar dažÄm bankÄm var atrisinÄt tikai filiÄlÄ. TurklÄt atkal daļa iedzÄ«votÄju daudz vairÄk uzticas fiziskai bankai nekÄ aplikÄcijai viedtÄlrunÄ«, arÄ« tas ir jÄÅem vÄrÄ.
TÄ rezultÄtÄ personai var bÅ«t daudz iemeslu atteikties no bankas produktiem (vai paÅ”ai bankai). Es mainÄ«ju darbu, un karÅ”u tarifs mainÄ«jÄs no algas uz āVienkÄrÅ”iem mirstÄ«gajiemā, kas ir mazÄk izdevÄ«gi. PÄrcÄlos uz citu pilsÄtu, kur nav bankas filiÄļu. Man nepatika mijiedarbÄ«ba ar nekvalificÄtu operatoru filiÄlÄ. Tas nozÄ«mÄ, ka konta slÄgÅ”anai var bÅ«t pat vairÄk iemeslu nekÄ produkta lietoÅ”anai.
Un klients var ne tikai skaidri izteikt savu nodomu ā atnÄkt uz banku un uzrakstÄ«t paziÅojumu, bet vienkÄrÅ”i pÄrtraukt produktu lietoÅ”anu, nepÄrtraucot lÄ«gumu. Tika nolemts izmantot maŔīnmÄcÄ«Å”anos un AI, lai izprastu Å”Ädas problÄmas.
TurklÄt klientu atkÄpÅ”anÄs var notikt jebkurÄ nozarÄ (telekomunikÄcijas, interneta pakalpojumu sniedzÄji, apdroÅ”inÄÅ”anas kompÄnijas kopumÄ, visur, kur ir klientu bÄze un periodiski darÄ«jumi).
Ko mÄs esam izdarÄ«juÅ”i
PirmkÄrt, bija jÄapraksta skaidra robeža ā no kura laika sÄkam uzskatÄ«t, ka klients ir aizgÄjis. No tÄs bankas viedokļa, kura mums sniedza datus mÅ«su darbam, klienta aktivitÄtes statuss bija binÄrs ā viÅÅ” ir vai nu aktÄ«vs, vai nÄ. TabulÄ "Activity" bija karodziÅÅ” ACTIVE_FLAG, kura vÄrtÄ«ba varÄja bÅ«t "0" vai "1" (attiecÄ«gi "NeaktÄ«vs" un "AktÄ«vs"). Un viss jau bÅ«tu labi, bet cilvÄks ir tÄds, ka kÄdu laiku var aktÄ«vi lietot, un tad uz mÄnesi izkrist no aktÄ«vÄ saraksta - saslimis, aizbrauca uz citu valsti atvaļinÄjumÄ vai pat aizbrauca pÄrbaudÄ«t karti no citas bankas. Vai varbÅ«t pÄc ilgÄka neaktivitÄtes perioda atsÄciet izmantot bankas pakalpojumus
TÄpÄc mÄs nolÄmÄm dÄ«kstÄves periodu saukt par noteiktu nepÄrtrauktu laika periodu, kurÄ tÄ karodziÅÅ” tika iestatÄ«ts uz ā0ā.
PÄc dažÄda ilguma neaktivitÄtes periodiem klienti pÄriet no neaktÄ«va uz aktÄ«vo. Mums ir iespÄja aprÄÄ·inÄt empÄ«riskÄs vÄrtÄ«bas āneaktivitÄtes periodu ticamÄ«basā pakÄpi - tas ir, varbÅ«tÄ«bu, ka persona pÄc Ä«slaicÄ«gas neaktivitÄtes atsÄks lietot bankas produktus.
Å eit mÄs nedaudz precizÄsim datu kopu, ar kuru mÄs sÄkÄm strÄdÄt. TÄtad banka sniedza apkopotu informÄciju par 19 mÄneÅ”iem Å”ÄdÄs tabulÄs:
āAktivitÄteā - ikmÄneÅ”a klientu darÄ«jumi (ar kartÄm, internetbankÄ un mobilajÄ bankÄ), ieskaitot algu sarakstu un informÄciju par apgrozÄ«jumu.
āKartesā - dati par visÄm klientam esoÅ”ajÄm kartÄm ar detalizÄtu tarifu grafiku.
āLÄ«gumiā - informÄcija par klienta lÄ«gumiem (gan atvÄrtiem, gan slÄgtiem): aizdevumiem, noguldÄ«jumiem utt., norÄdot katra parametrus.
āKlientiā - demogrÄfisko datu kopums (dzimums un vecums) un kontaktinformÄcijas pieejamÄ«ba.
Darbam mums bija nepiecieÅ”ami visi galdi, izÅemot āKartiā.
Å eit bija vÄl viena grÅ«tÄ«ba - Å”ajos datos banka nav norÄdÄ«jusi, kÄda darbÄ«ba kartÄs notikusi. Tas ir, mÄs varÄjÄm saprast, vai darÄ«jumi ir vai nebija, bet mÄs vairs nevarÄjÄm noteikt to veidu. LÄ«dz ar to nebija skaidrs, vai klients izÅem skaidru naudu, saÅem algu vai tÄrÄ naudu pirkumiem. Mums nebija arÄ« datu par kontu atlikumiem, kas bÅ«tu noderÄjuÅ”i.
Pati izlase bija objektÄ«va ā Å”ajÄ sadaÄ¼Ä 19 mÄneÅ”u laikÄ banka nemÄÄ£inÄja noturÄt klientus un samazinÄt aizplÅ«Å”anu.
TÄtad, par neaktivitÄtes periodiem.
Lai formulÄtu churn definÄ«ciju, ir jÄizvÄlas neaktivitÄtes periods. Lai izveidotu novirzes prognozi noteiktÄ laika brÄ«dÄ« , jums ir jÄbÅ«t vismaz 3 mÄneÅ”u klientu vÄsturei ar intervÄlu . MÅ«su vÄsture bija ierobežota lÄ«dz 19 mÄneÅ”iem, tÄpÄc mÄs nolÄmÄm izmantot 6 mÄneÅ”u dÄ«kstÄves periodu, ja tas ir pieejams. Un minimÄlajam periodam augstas kvalitÄtes prognozei mÄs paÅÄmÄm 3 mÄneÅ”us. MÄs empÄ«riski izmantojÄm skaitļus par 3 un 6 mÄneÅ”iem, pamatojoties uz klientu datu uzvedÄ«bas analÄ«zi.
MÄs formulÄjÄm Å”Ädu definÄ«ciju: klientu atlaiÅ”anas mÄnesis Å”is ir pirmais mÄnesis ar ACTIVE_FLAG=0, kur no Ŕī mÄneÅ”a laukÄ ACTIVE_FLAG ir vismaz seÅ”as secÄ«gas nulles, citiem vÄrdiem sakot, mÄnesis, no kura klients bija neaktÄ«vs 6 mÄneÅ”us.
AizbraukuŔo klientu skaits
AtlikuŔo klientu skaits
KÄ tiek aprÄÄ·inÄts atteikums?
Å Ädos konkursos un vispÄr praksÄ bieži tiek prognozÄta aizplÅ«Å”ana Å”ÄdÄ veidÄ. Klients izmanto preces un pakalpojumus dažÄdos laika periodos, dati par mijiedarbÄ«bu ar viÅu tiek attÄloti kÄ fiksÄta garuma n pazÄ«mju vektors. VisbiežÄk Ŕī informÄcija ietver:
LietotÄju raksturojoÅ”ie dati (demogrÄfiskie dati, mÄrketinga segments).
Bankas produktu un pakalpojumu izmantoÅ”anas vÄsture (tÄs ir klientu darbÄ«bas, kas vienmÄr ir saistÄ«tas ar noteiktu mums vajadzÄ«gÄ intervÄla laiku vai periodu).
ÄrÄjie dati, ja tos bija iespÄjams iegÅ«t - piemÄram, atsauksmes no sociÄlajiem tÄ«kliem.
Un pÄc tam viÅi iegÅ«st churn definÄ«ciju, kas katram uzdevumam ir atŔķirÄ«ga. PÄc tam viÅi izmanto maŔīnmÄcÄ«Å”anÄs algoritmu, kas paredz klienta aizieÅ”anas iespÄjamÄ«bu pamatojoties uz faktoru vektoru . Algoritma apmÄcÄ«bai tiek izmantots viens no labi zinÄmajiem lÄmumu koku ansambļu konstruÄÅ”anas ietvariem, XGBoost, LightGBM, CatBoost vai to modifikÄcijas.
Algoritms pats par sevi nav slikts, taÄu tam ir vairÄki nopietni trÅ«kumi, kad runa ir par churn prognozÄÅ”anu.
ViÅam nav tÄ saucamÄs "atmiÅas". Modeļa ievade ir noteikts skaits funkciju, kas atbilst paÅ”reizÄjam laika punktam. Lai saglabÄtu informÄciju par parametru izmaiÅu vÄsturi, ir jÄaprÄÄ·ina Ä«paÅ”as pazÄ«mes, kas raksturo parametru izmaiÅas laika gaitÄ, piemÄram, bankas darÄ«jumu skaits vai apjoms pÄdÄjo 1,2,3, XNUMX, XNUMX mÄneÅ”u laikÄ. Å Ä« pieeja var tikai daļÄji atspoguļot pagaidu izmaiÅu bÅ«tÄ«bu.
FiksÄts prognozÄÅ”anas horizonts. Modelis spÄj paredzÄt tikai klientu atteikÅ”anos uz iepriekÅ” noteiktu laika periodu, piemÄram, prognozi vienu mÄnesi iepriekÅ”. Ja prognoze ir nepiecieÅ”ama citam laika periodam, piemÄram, trÄ«s mÄneÅ”iem, tad jums ir jÄpÄrveido apmÄcÄ«bas komplekts un jÄpÄrmÄca jauns modelis.
MÅ«su pieeja
MÄs uzreiz nolÄmÄm, ka neizmantosim standarta pieejas. Bez mums ÄempionÄtÄ reÄ£istrÄjÄs vÄl 497 cilvÄki, kuriem katram aiz muguras bija ievÄrojama pieredze. TÄpÄc mÄÄ£inÄt kaut ko darÄ«t saskaÅÄ ar standarta shÄmu Å”Ädos apstÄkļos nav laba ideja.
Un mÄs sÄkÄm risinÄt problÄmas, ar kurÄm saskaras binÄrÄs klasifikÄcijas modelis, prognozÄjot klientu atteikÅ”anÄs laiku varbÅ«tÄ«bas sadalÄ«jumu. Var redzÄt lÄ«dzÄ«gu pieeju Å”eit, tas ļauj elastÄ«gÄk prognozÄt apgrÅ«tinÄjumu un pÄrbaudÄ«t sarežģītÄkas hipotÄzes nekÄ klasiskajÄ pieejÄ. KÄ sadalÄ«jumu saime, kas modelÄ izplÅ«des laiku, mÄs izvÄlÄjÄmies sadalÄ«jumu Veibuls par tÄ plaÅ”o izmantoÅ”anu izdzÄ«voÅ”anas analÄ«zÄ. Klienta uzvedÄ«bu var uzskatÄ«t par sava veida izdzÄ«voÅ”anu.
Å eit ir piemÄri Veibula varbÅ«tÄ«bas blÄ«vuma sadalÄ«jumam atkarÄ«bÄ no parametriem Šø :
Å Ä« ir iespÄjamÄ«bas blÄ«vuma funkcija trÄ«s dažÄdiem klientiem, kuri laika gaitÄ ir mainÄ«juÅ”ies. Laiks tiek uzrÄdÄ«ts mÄneÅ”os. Citiem vÄrdiem sakot, Å”is grafiks parÄda, kad klients, visticamÄk, atteiksies nÄkamo divu mÄneÅ”u laikÄ. KÄ redzat, klientam ar izplatÄ«Å”anu ir lielÄka iespÄja aiziet agrÄk nekÄ klientiem ar Weibull(2, 0.5) un Weibull. (3,1) sadalÄ«jumi.
RezultÄts ir modelis, kas piemÄrots katram klientam, ikvienam
mÄnesis prognozÄ Veibula sadalÄ«juma parametrus, kas vislabÄk atspoguļo aizplÅ«Å”anas varbÅ«tÄ«bas raÅ”anos laika gaitÄ. SÄ«kÄk:
MÄcÄ«bu komplekta mÄrÄ·a funkcijas ir laiks, kas konkrÄtam klientam atlicis lÄ«dz pÄrtraukumam noteiktÄ mÄnesÄ«.
Ja klientam nav atteikÅ”anÄs rÄdÄ«tÄja, mÄs pieÅemam, ka atteikÅ”anÄs laiks ir lielÄks par mÄneÅ”u skaitu no paÅ”reizÄjÄ mÄneÅ”a lÄ«dz mÅ«su vÄstures beigÄm.
Izmantotais modelis: atkÄrtots neironu tÄ«kls ar LSTM slÄni.
KÄ zaudÄjuma funkciju mÄs izmantojam Veibula sadalÄ«juma negatÄ«vÄs log-iespÄjamÄ«bas funkciju.
Šeit ir Ŕīs metodes priekŔrocības:
VarbÅ«tÄ«bu sadalÄ«jums papildus acÄ«mredzamajai binÄrÄs klasifikÄcijas iespÄjai ļauj elastÄ«gi prognozÄt dažÄdus notikumus, piemÄram, vai klients pÄrtrauks izmantot bankas pakalpojumus 3 mÄneÅ”u laikÄ. TÄpat, ja nepiecieÅ”ams, Å”im sadalÄ«jumam var aprÄÄ·inÄt dažÄdus rÄdÄ«tÄjus.
LSTM atkÄrtotajam neironu tÄ«klam ir atmiÅa, un tas efektÄ«vi izmanto visu pieejamo vÄsturi. Kad stÄsts tiek paplaÅ”inÄts vai pilnveidots, precizitÄte palielinÄs.
Pieeju var viegli mÄrogot, sadalot laika periodus mazÄkos (piemÄram, sadalot mÄneÅ”us nedÄļÄs).
TaÄu ar laba modeļa izveidi vien nepietiek, ir arÄ« pareizi jÄnovÄrtÄ tÄ kvalitÄte.
KÄ tika novÄrtÄta kvalitÄte?
MÄs kÄ metriku izvÄlÄjÄmies kÄpuma lÄ«kni. Tas tiek izmantots uzÅÄmÄjdarbÄ«bÄ Å”Ädos gadÄ«jumos, jo tas ir skaidri interpretÄts, tas ir labi aprakstÄ«ts Å”eit Šø Å”eit. Ja jÅ«s aprakstÄ«tu Ŕīs metrikas nozÄ«mi vienÄ teikumÄ, tas bÅ«tu: "Cik reizes algoritms veic vislabÄko prognozi pirmajÄ % nekÄ nejauÅ”i."
ApmÄcÄ«bu modeļi
Konkursa nosacÄ«jumi nenoteica konkrÄtu kvalitÄtes rÄdÄ«tÄju, pÄc kura varÄtu salÄ«dzinÄt dažÄdus modeļus un pieejas. TurklÄt aprites definÄ«cija var bÅ«t dažÄda un var bÅ«t atkarÄ«ga no problÄmas izklÄsta, ko, savukÄrt, nosaka biznesa mÄrÄ·i. TÄpÄc, lai saprastu, kura metode ir labÄka, mÄs apmÄcÄ«jÄm divus modeļus:
Bieži lietota binÄrÄs klasifikÄcijas pieeja, izmantojot ansambļa lÄmumu koka maŔīnmÄcÄ«Å”anÄs algoritmu (LightGBM);
Weibull-LSTM modelis
Testa komplekts sastÄvÄja no 500 iepriekÅ” atlasÄ«tiem klientiem, kuri nebija apmÄcÄ«bu komplektÄ. Hiperparametri tika atlasÄ«ti modelim, izmantojot savstarpÄju validÄciju, kas sadalÄ«ta pÄc klienta. Katra modeļa apmÄcÄ«bai tika izmantotas vienas un tÄs paÅ”as funkciju kopas.
SakarÄ ar to, ka modelim nav atmiÅas, tam tika Åemtas Ä«paÅ”as funkcijas, kas parÄda viena mÄneÅ”a parametru izmaiÅu attiecÄ«bu pret vidÄjo parametru vÄrtÄ«bu pÄdÄjo trÄ«s mÄneÅ”u laikÄ. Kas raksturo vÄrtÄ«bu izmaiÅu Ätrumu pÄdÄjo trÄ«s mÄneÅ”u laikÄ. Bez tÄ uz Random Forest balstÄ«tais modelis bÅ«tu neizdevÄ«gÄkÄ situÄcijÄ salÄ«dzinÄjumÄ ar Weibull-LSTM.
KÄpÄc LSTM ar Weibull izplatÄ«Å”anu ir labÄks par ansambļa lÄmumu koka pieeju
Å eit viss ir skaidrs tikai pÄris bildÄs.
PacelÅ”anas lÄ«knes salÄ«dzinÄjums klasiskajam algoritmam un Weibull-LSTM
PaaugstinÄÅ”anas lÄ«knes metrikas salÄ«dzinÄjums pa mÄneÅ”iem klasiskajam algoritmam un Weibull-LSTM
KopumÄ LSTM gandrÄ«z visos gadÄ«jumos ir pÄrÄks par klasisko algoritmu.
Kakla prognoze
Modelis, kura pamatÄ ir atkÄrtots neironu tÄ«kls ar LSTM ŔūnÄm ar Veibula sadalÄ«jumu, var iepriekÅ” paredzÄt atteikÅ”anos, piemÄram, prognozÄt klientu samazinÄÅ”anos nÄkamo n mÄneÅ”u laikÄ. Apsveriet gadÄ«jumu n = 3. Å ajÄ gadÄ«jumÄ neironu tÄ«klam katram mÄnesim ir pareizi jÄnosaka, vai klients aizies, sÄkot no nÄkamÄ mÄneÅ”a un lÄ«dz n-tajam mÄnesim. Citiem vÄrdiem sakot, tai pareizi jÄnosaka, vai klients paliks pÄc n mÄneÅ”iem. To var uzskatÄ«t par prognozi jau iepriekÅ”: paredzot brÄ«di, kad klients tikai sÄka domÄt par aizieÅ”anu.
SalÄ«dzinÄsim Weibull-LSTM paaugstinÄÅ”anas lÄ«kni 1, 2 un 3 mÄneÅ”us pirms aizplÅ«Å”anas:
IepriekÅ” jau rakstÄ«jÄm, ka svarÄ«gas ir arÄ« prognozes, kas tiek veiktas klientiem, kuri kÄdu laiku vairs nav aktÄ«vi. TÄpÄc Å”eit mÄs pievienosim izlasei tÄdus gadÄ«jumus, kad aizgÄjuÅ”ais klients jau ir bijis neaktÄ«vs vienu vai divus mÄneÅ”us, un pÄrbaudÄ«sim, vai Weibull-LSTM pareizi klasificÄ Å”Ädus gadÄ«jumus kÄ churn. TÄ kÄ izlasÄ bija Å”Ädi gadÄ«jumi, mÄs sagaidÄm, ka tÄ«kls tos labi apstrÄdÄs:
Klientu noturÄÅ”ana
PatiesÄ«bÄ tas ir galvenais, ko var izdarÄ«t, turot rokÄs informÄciju, ka tÄdi un tÄdi klienti gatavojas pÄrtraukt produkta lietoÅ”anu. RunÄjot par tÄda modeļa izveidi, kas varÄtu piedÄvÄt klientiem kaut ko noderÄ«gu, lai viÅus noturÄtu, to nevar izdarÄ«t, ja jums nav lÄ«dzÄ«gu mÄÄ£inÄjumu, kas beigtos labi.
Mums nebija Å”Äda stÄsta, tÄpÄc mÄs to izlÄmÄm Å”Ädi.
MÄs veidojam modeli, kas katram klientam identificÄ interesantus produktus.
Katru mÄnesi mÄs veicam klasifikatoru un identificÄjam potenciÄli aizejoÅ”os klientus.
Dažiem klientiem piedÄvÄjam preci, pÄc modeļa no 1. punkta, un atceramies mÅ«su rÄ«cÄ«bu.
PÄc dažiem mÄneÅ”iem mÄs aplÅ«kojam, kuri no Å”iem potenciÄli aizejoÅ”ajiem klientiem aizgÄja un kuri palika. TÄdÄjÄdi mÄs veidojam apmÄcÄ«bas paraugu.
MÄs apmÄcÄm modeli, izmantojot 4. solÄ« iegÅ«to vÄsturi.
PÄc izvÄles mÄs atkÄrtojam procedÅ«ru, aizstÄjot modeli no 1. darbÄ«bas ar modeli, kas iegÅ«ts 5. darbÄ«bÄ.
Å Ädas saglabÄÅ”anas kvalitÄtes pÄrbaudi var veikt ar regulÄru A/B testÄÅ”anu ā potenciÄli aizbraukuÅ”os klientus sadalÄm divÄs grupÄs. Vienam mÄs piedÄvÄjam produktus, pamatojoties uz mÅ«su saglabÄÅ”anas modeli, bet otram mÄs neko nepiedÄvÄjam. MÄs nolÄmÄm apmÄcÄ«t modeli, kas varÄtu bÅ«t noderÄ«gs jau mÅ«su piemÄra 1. punktÄ.
MÄs vÄlÄjÄmies padarÄ«t segmentÄciju pÄc iespÄjas interpretÄjamÄku. Lai to izdarÄ«tu, mÄs izvÄlÄjÄmies vairÄkas viegli interpretÄjamas funkcijas: kopÄjais darÄ«jumu skaits, algas, kopÄjais konta apgrozÄ«jums, vecums, dzimums. Tabulas āKartesā lÄ«dzekļi netika Åemti vÄrÄ kÄ neinformatÄ«vi, un 3. tabulas āLÄ«gumiā lÄ«dzekļi netika Åemti vÄrÄ apstrÄdes sarežģītÄ«bas dÄļ, lai izvairÄ«tos no datu noplÅ«des starp validÄcijas kopu un apmÄcÄ«bu kopu.
KlasterizÄcija tika veikta, izmantojot Gausa maisÄ«jumu modeļus. Akaike informÄcijas kritÄrijs ļÄva mums noteikt 2 optimus. Pirmais optimÄlais atbilst 1 klasterim. Otrais optimÄlais, mazÄk izteikts, atbilst 80 klasteriem. Pamatojoties uz Å”o rezultÄtu, mÄs varam izdarÄ«t Å”Ädu secinÄjumu: ir ÄrkÄrtÄ«gi grÅ«ti sadalÄ«t datus klasteros bez a priori sniegtas informÄcijas. LabÄkai klasterizÄcijai ir nepiecieÅ”ami dati, kas detalizÄti apraksta katru klientu.
TÄpÄc tika apsvÄrta supervadÄ«tas mÄcÄ«Å”anÄs problÄma, lai katram klientam piedÄvÄtu citu produktu. Tika izskatÄ«ti Å”Ädi produkti: āTermiÅdepozÄ«tsā, āKredÄ«tkarteā, āOverdraftsā, āPatÄriÅa kredÄ«tsā, āAuto kredÄ«tsā, āHipotÄkaā.
Dati ietvÄra vÄl vienu produkta veidu: āNorÄÄ·inu kontsā. Bet mÄs to neuzskatÄ«jÄm zemÄ informÄcijas satura dÄļ. LietotÄjiem, kuri ir bankas klienti, t.i. nepÄrstÄja lietot savus produktus, tika izveidots modelis, lai paredzÄtu, kurÅ” produkts viÅus varÄtu interesÄt. Par modeli tika izvÄlÄta loÄ£istiskÄ regresija, un kÄ kvalitÄtes novÄrtÄjuma metrika tika izmantota Lift vÄrtÄ«ba pirmajÄm 10 procentilÄm.
Modeļa kvalitÄti var novÄrtÄt attÄlÄ.
Produktu ieteikumu modeļa rezultÄti klientiem
Kopsavilkums
Å Ä« pieeja mums atnesa pirmo vietu kategorijÄ āAI bankÄsā RAIF-Challenge 2017 AI ÄempionÄtÄ.
AcÄ«mredzot galvenais bija pieiet problÄmai no netradicionÄla leÅÄ·a un izmantot metodi, ko parasti izmanto citÄs situÄcijÄs.
Lai gan liela lietotÄju aizplÅ«Å”ana var bÅ«t dabas katastrofa pakalpojumiem.
Å o metodi var Åemt vÄrÄ jebkurÄ citÄ jomÄ, kur ir svarÄ«gi Åemt vÄrÄ aizplÅ«Å”anu, ne tikai bankÄm. PiemÄram, mÄs to izmantojÄm, lai aprÄÄ·inÄtu savu aizplÅ«Å”anu - Rostelecom SibÄ«rijas un SanktpÄterburgas filiÄlÄs.
UzÅÄmums "Datu ieguves laboratorija" "MeklÄÅ”anas portÄls "Sputnik"