Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Weithiau, er mwyn datrys problem, does ond angen i chi edrych arni o ongl wahanol. Hyd yn oed os yw problemau tebyg wedi'u datrys yn yr un modd dros y 10 mlynedd diwethaf gyda gwahanol effeithiau, nid yw'n ffaith mai'r dull hwn yw'r unig un.

Mae pwnc fel corddi cwsmeriaid. Mae'r peth yn anochel, oherwydd gall cwsmeriaid unrhyw gwmni, am lawer o resymau, roi'r gorau i ddefnyddio ei gynhyrchion neu ei wasanaethau. Wrth gwrs, i gwmni, mae corddi yn weithred naturiol, ond nid y peth mwyaf dymunol, felly mae pawb yn ceisio lleihau'r corddi hwn. Yn well eto, rhagfynegwch y tebygolrwydd o gorddi ar gyfer categori penodol o ddefnyddwyr, neu ddefnyddiwr penodol, ac awgrymu rhai camau i'w cadw.

Mae angen dadansoddi a cheisio cadw'r cleient, os yn bosibl, am y rhesymau canlynol o leiaf:

  • mae denu cwsmeriaid newydd yn ddrytach na gweithdrefnau cadw. Er mwyn denu cwsmeriaid newydd, fel rheol, mae angen i chi wario rhywfaint o arian (hysbysebu), tra gellir actifadu cwsmeriaid presennol gyda chynnig arbennig gydag amodau arbennig;
  • Deall y rhesymau pam mae cwsmeriaid yn gadael yw'r allwedd i wella cynhyrchion a gwasanaethau.

Mae yna ddulliau safonol o ragfynegi corddi. Ond yn un o bencampwriaethau AI, penderfynasom roi cynnig ar ddosbarthiad Weibull ar gyfer hyn. Fe'i defnyddir amlaf ar gyfer dadansoddi goroesiad, rhagweld y tywydd, dadansoddi trychineb naturiol, peirianneg ddiwydiannol ac ati. Mae dosbarthiad Weibull yn swyddogaeth ddosbarthu arbennig sydd wedi'i baramedroli gan ddau baramedr Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol и Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Wikipedia

Yn gyffredinol, mae'n beth diddorol, ond ar gyfer rhagweld all-lifoedd, ac mewn fintech yn gyffredinol, nid yw'n cael ei ddefnyddio mor aml. O dan y toriad byddwn yn dweud wrthych sut y gwnaethom ni (Labordy Mwyngloddio Data) hyn, gan ennill aur ar yr un pryd yn y Bencampwriaeth Deallusrwydd Artiffisial yn y categori “AI mewn Banciau”.

Ynglŷn â chorddi yn gyffredinol

Gadewch i ni ddeall ychydig am beth yw corddi cwsmeriaid a pham ei fod mor bwysig. Mae sylfaen cwsmeriaid yn bwysig i fusnes. Mae cwsmeriaid newydd yn dod i'r sylfaen hon, er enghraifft, ar ôl dysgu am gynnyrch neu wasanaeth o hysbyseb, yn byw am beth amser (defnyddio'r cynhyrchion yn weithredol) ac ar ôl peth amser yn rhoi'r gorau i'w ddefnyddio. Gelwir y cyfnod hwn yn “Cylch Bywyd Cwsmer” - term sy'n disgrifio'r camau y mae cwsmer yn mynd drwyddynt pan fydd yn dysgu am gynnyrch, yn gwneud penderfyniad prynu, yn talu, yn defnyddio ac yn dod yn ddefnyddiwr ffyddlon, ac yn y pen draw yn rhoi'r gorau i ddefnyddio'r cynnyrch. am ryw reswm neu'i gilydd. Yn unol â hynny, corddi yw cam olaf cylch bywyd y cleient, pan fydd y cleient yn rhoi’r gorau i ddefnyddio’r gwasanaethau, ac i fusnes mae hyn yn golygu bod y cleient wedi peidio â dod ag elw nac unrhyw fudd o gwbl.

Mae pob cleient banc yn berson penodol sy'n dewis un cerdyn banc neu'r llall yn benodol ar gyfer ei anghenion. Os ydych chi'n teithio'n aml, bydd cerdyn â milltiroedd yn ddefnyddiol. Yn prynu llawer - helo, cerdyn arian yn ôl. Mae'n prynu llawer mewn siopau penodol - ac mae plastig partner arbennig yn barod ar gyfer hyn. Wrth gwrs, weithiau dewisir cerdyn yn seiliedig ar y maen prawf “Gwasanaeth rhataf”. Yn gyffredinol, mae digon o newidynnau yma.

Ac mae person hefyd yn dewis y banc ei hun - a oes unrhyw bwynt mewn dewis cerdyn gan fanc y mae ei ganghennau ym Moscow a'r rhanbarth yn unig, pan fyddwch chi'n dod o Khabarovsk? Hyd yn oed os yw cerdyn o fanc o'r fath o leiaf 2 gwaith yn fwy proffidiol, mae presenoldeb canghennau banc gerllaw yn dal i fod yn faen prawf pwysig. Ydy, mae 2019 yma eisoes a digidol yw ein popeth, ond dim ond mewn cangen y gellir datrys nifer o faterion gyda rhai banciau. Hefyd, unwaith eto, mae rhyw ran o'r boblogaeth yn ymddiried mewn banc corfforol llawer mwy na chymhwysiad ar ffôn clyfar, mae angen ystyried hyn hefyd.

O ganlyniad, efallai y bydd gan berson lawer o resymau dros wrthod cynhyrchion banc (neu'r banc ei hun). Newidiais swyddi, a newidiodd y tariff cerdyn o gyflog i “For mere mortals,” sy'n llai proffidiol. Symudais i ddinas arall lle nad oes canghennau banc. Doeddwn i ddim yn hoffi'r rhyngweithio â'r gweithredwr heb gymhwyso yn y gangen. Hynny yw, gall fod hyd yn oed mwy o resymau dros gau cyfrif nag am ddefnyddio'r cynnyrch.

Ac ni all y cleient yn unig yn mynegi ei fwriad yn glir - dod i'r banc ac ysgrifennu datganiad, ond yn syml rhoi'r gorau i ddefnyddio'r cynnyrch heb derfynu'r contract. Penderfynwyd defnyddio dysgu peiriant ac AI i ddeall problemau o'r fath.

Ar ben hynny, gall corddi cwsmeriaid ddigwydd mewn unrhyw ddiwydiant (telathrebu, darparwyr Rhyngrwyd, cwmnïau yswiriant, yn gyffredinol, lle bynnag y mae sylfaen cwsmeriaid a thrafodion cyfnodol).

Beth ydyn ni wedi'i wneud

Yn gyntaf oll, roedd angen disgrifio ffin glir - o ba amser rydym yn dechrau ystyried bod y cleient wedi gadael. O safbwynt y banc a roddodd y data i ni ar gyfer ein gwaith, roedd statws gweithgaredd y cleient yn ddeuaidd - mae naill ai'n weithgar ai peidio. Roedd baner ACTIVE_FLAG yn y tabl "Gweithgaredd", a gallai ei werth fod naill ai "0" neu "1" ("Anweithredol" a "Actif") yn y drefn honno. A byddai popeth yn iawn, ond mae person yn golygu y gall ei ddefnyddio'n weithredol am beth amser, ac yna disgyn allan o'r rhestr weithredol am fis - aeth yn sâl, aeth i wlad arall ar wyliau, neu hyd yn oed aeth i brofi a cerdyn o fanc arall. Neu efallai ar ôl cyfnod hir o anweithgarwch, dechreuwch ddefnyddio gwasanaethau’r banc eto

Felly, penderfynasom alw cyfnod o anweithgarwch yn gyfnod parhaus penodol o amser pan osodwyd y faner ar ei gyfer i “0”.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Mae cleientiaid yn symud o fod yn segur i actif ar ôl cyfnodau o anweithgarwch o wahanol hyd. Mae gennym y cyfle i gyfrifo graddau gwerth empirig “dibynadwyedd cyfnodau o anweithgarwch” - hynny yw, y tebygolrwydd y bydd person yn dechrau defnyddio cynhyrchion banc eto ar ôl anweithgarwch dros dro.

Er enghraifft, mae'r graff hwn yn dangos ailddechrau gweithgarwch (ACTIVE_FLAG=1) cleientiaid ar ôl sawl mis o anweithgarwch (ACTIVE_FLAG=0).

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Yma byddwn yn egluro ychydig ar y set ddata y gwnaethom ddechrau gweithio gyda hi. Felly, darparodd y banc wybodaeth agregedig am 19 mis yn y tablau canlynol:

  • “Gweithgaredd” - trafodion cwsmeriaid misol (drwy gardiau, mewn bancio Rhyngrwyd a bancio symudol), gan gynnwys y gyflogres a gwybodaeth am drosiant.
  • “Cardiau” - data am yr holl gardiau sydd gan y cleient, gydag amserlen tariff fanwl.
  • "Cytundebau" - gwybodaeth am gytundebau'r cleient (agored a chaeedig): benthyciadau, blaendaliadau, ac ati, gan nodi paramedrau pob un.
  • “Cwsmeriaid” - set o ddata demograffig (rhyw ac oedran) ac argaeledd gwybodaeth gyswllt.

Ar gyfer gwaith roedd angen y tablau i gyd heblaw am y “Map”.

Roedd anhawster arall yma - yn y data hwn nid oedd y banc yn nodi pa fath o weithgaredd oedd yn digwydd ar y cardiau. Hynny yw, gallem ddeall a oedd trafodion ai peidio, ond ni allem benderfynu ar eu math mwyach. Felly, nid oedd yn glir a oedd y cleient yn tynnu arian parod, yn derbyn cyflog, neu'n gwario'r arian ar bryniannau. Nid oedd gennym ychwaith ddata ar falansau cyfrifon, a fyddai wedi bod yn ddefnyddiol.

Roedd y sampl ei hun yn ddiduedd - yn y sampl hwn, dros 19 mis, ni wnaeth y banc unrhyw ymdrechion i gadw cwsmeriaid a lleihau all-lif.

Felly, am gyfnodau o anweithgarwch.

Er mwyn llunio diffiniad o gorddi, rhaid dewis cyfnod o anweithgarwch. Creu rhagolwg corddi ar bwynt mewn amser Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol, rhaid bod gennych hanes cwsmer o 3 mis o leiaf ar ysbaid Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol. Roedd ein hanes wedi’i gyfyngu i 19 mis, felly fe benderfynon ni gymryd cyfnod o anweithgarwch o 6 mis, os oedd ar gael. Ac am y cyfnod lleiaf ar gyfer rhagolwg o ansawdd uchel, fe wnaethom gymryd 3 mis. Cymerwyd y ffigurau gennym am 3 a 6 mis yn empirig yn seiliedig ar ddadansoddiad o ymddygiad data cwsmeriaid.

Fe wnaethom lunio'r diffiniad o gorddi fel a ganlyn: mis o gorddi cwsmer Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol dyma'r mis cyntaf gydag ACTIVE_FLAG=0, lle o'r mis hwn mae o leiaf chwe sero yn olynol yn y maes ACTIVE_FLAG, mewn geiriau eraill, y mis y bu'r cleient yn segur am 6 mis.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Nifer y cleientiaid a adawodd

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Nifer y cleientiaid sy'n weddill

Sut mae corddi yn cael ei gyfrifo?

Mewn cystadlaethau o'r fath, ac yn ymarferol yn gyffredinol, mae all-lif yn aml yn cael ei ragweld fel hyn. Mae'r cleient yn defnyddio cynhyrchion a gwasanaethau ar wahanol gyfnodau o amser, mae data ar ryngweithio ag ef yn cael ei gynrychioli fel fector o nodweddion hyd sefydlog n. Yn fwyaf aml mae'r wybodaeth hon yn cynnwys:

  • Data sy'n nodweddu'r defnyddiwr (data demograffig, segment marchnata).
  • Hanes y defnydd o gynhyrchion a gwasanaethau bancio (mae'r rhain yn gamau gweithredu cwsmeriaid sydd bob amser yn gysylltiedig ag amser penodol neu gyfnod o'r egwyl sydd ei angen arnom).
  • Data allanol, pe bai'n bosibl ei gael - er enghraifft, adolygiadau o rwydweithiau cymdeithasol.

Ac ar ôl hynny, maent yn deillio diffiniad o gorddi, gwahanol ar gyfer pob tasg. Yna maent yn defnyddio algorithm dysgu peiriant, sy'n rhagweld y tebygolrwydd y bydd cleient yn gadael Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol yn seiliedig ar fector o ffactorau Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol. I hyfforddi'r algorithm, defnyddir un o'r fframweithiau adnabyddus ar gyfer adeiladu ensembles o goed penderfynu, XGBoost, GolauGBM, CatBoost neu addasiadau iddynt.

Nid yw'r algorithm ei hun yn ddrwg, ond mae ganddo nifer o anfanteision difrifol o ran rhagweld corddi.

  • Nid oes ganddo'r hyn a elwir yn "gof". Mae mewnbwn y model yn nifer penodol o nodweddion sy'n cyfateb i'r pwynt amser presennol. Er mwyn storio gwybodaeth am hanes newidiadau mewn paramedrau, mae angen cyfrifo nodweddion arbennig sy'n nodweddu newidiadau mewn paramedrau dros amser, er enghraifft, nifer neu swm y trafodion banc dros y 1,2,3, XNUMX, XNUMX mis diwethaf. Dim ond yn rhannol y gall y dull hwn adlewyrchu natur newidiadau dros dro.
  • Gorwel rhagweld sefydlog. Dim ond am gyfnod rhagnodedig o amser y gall y model ei ragweld, er enghraifft, rhagolwg fis ymlaen llaw. Os oes angen rhagolwg am gyfnod gwahanol o amser, er enghraifft, tri mis, yna mae angen i chi ailadeiladu'r set hyfforddi ac ailhyfforddi model newydd.

Ein hymagwedd

Fe wnaethom benderfynu ar unwaith na fyddem yn defnyddio dulliau safonol. Yn ogystal â ni, cofrestrodd 497 yn fwy o bobl yn y bencampwriaeth, gyda phob un ohonynt â phrofiad sylweddol y tu ôl iddynt. Felly nid yw ceisio gwneud rhywbeth yn ôl cynllun safonol dan amodau o'r fath yn syniad da.

Ac fe ddechreuon ni ddatrys y problemau sy'n wynebu'r model dosbarthu deuaidd trwy ragfynegi dosbarthiad tebygolrwydd amseroedd corddi cwsmeriaid. Gellir gweld dull tebyg yma, mae'n eich galluogi i ragweld corddi yn fwy hyblyg a rhoi prawf ar ddamcaniaethau mwy cymhleth nag yn y dull clasurol. Fel teulu o ddosbarthiadau yn modelu'r amser all-lif, fe ddewison ni'r dosbarthiad Weibull am ei ddefnydd eang mewn dadansoddiad goroesi. Gellir ystyried ymddygiad y cleient fel math o oroesiad.

Dyma enghreifftiau o ddosbarthiadau dwysedd tebygolrwydd Weibull yn dibynnu ar baramedrau Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol и Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol:

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Dyma swyddogaeth dwysedd tebygolrwydd o dri chwsmer gwahanol yn corddi dros amser. Cyflwynir amser mewn misoedd. Mewn geiriau eraill, mae'r graff hwn yn dangos pryd mae cleient yn fwyaf tebygol o gorddi yn ystod y ddau fis nesaf Fel y gwelwch, mae gan gleient â dosbarthiad fwy o botensial i adael yn gynharach na chleientiaid gyda'r Weibull(2, 0.5) a Weibull (3,1) dosraniadau.

Y canlyniad yw model sydd, ar gyfer pob cleient, ar gyfer pob
mis yn rhagweld y paramedrau y dosbarthiad Weibull, sy'n adlewyrchu orau y digwyddiad y tebygolrwydd o all-lif dros amser. Yn fwy manwl:

  • Y nodweddion targed ar y set hyfforddi yw'r amser sy'n weddill tan y corddi mewn mis penodol ar gyfer cleient penodol.
  • Os nad oes cyfradd corddi i gwsmer, tybiwn fod yr amser corddi yn fwy na nifer y misoedd o'r mis presennol hyd ddiwedd yr hanes sydd gennym.
  • Model a ddefnyddir: rhwydwaith niwral cylchol gyda haen LSTM.
  • Fel swyddogaeth golled, rydym yn defnyddio'r swyddogaeth log-tebygolrwydd negyddol ar gyfer y dosbarthiad Weibull.

Dyma fanteision y dull hwn:

  • Mae dosbarthiad tebygolrwydd, yn ychwanegol at y posibilrwydd amlwg o ddosbarthiad deuaidd, yn caniatáu rhagfynegiad hyblyg o ddigwyddiadau amrywiol, er enghraifft, a fydd cleient yn rhoi'r gorau i ddefnyddio gwasanaethau'r banc o fewn 3 mis. Hefyd, os oes angen, gellir cyfartaleddu metrigau amrywiol dros y dosbarthiad hwn.
  • Mae gan rwydwaith niwral cylchol LSTM gof ac mae'n defnyddio'r holl hanes sydd ar gael yn effeithiol. Wrth i'r stori gael ei hehangu neu ei mireinio, mae cywirdeb yn cynyddu.
  • Gellir graddio'r dull yn hawdd wrth rannu cyfnodau amser yn rhai llai (er enghraifft, wrth rannu misoedd yn wythnosau).

Ond nid yw'n ddigon creu model da; mae angen i chi hefyd werthuso ei ansawdd yn iawn.

Sut yr aseswyd ansawdd?

Fe wnaethon ni ddewis Lift Curve fel y metrig. Fe'i defnyddir mewn busnes ar gyfer achosion o'r fath oherwydd ei ddehongliad clir, fe'i disgrifir yn dda yma и yma. Os disgrifiwch ystyr y metrig hwn mewn un frawddeg, byddai'n “Sawl gwaith mae'r algorithm yn gwneud y rhagfynegiad gorau yn y gyntaf Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol% nag ar hap."

Modelau hyfforddi

Ni sefydlodd amodau'r gystadleuaeth fetrig ansawdd penodol y gellir ei ddefnyddio i gymharu modelau a dulliau gwahanol. Ar ben hynny, gall y diffiniad o gorddi fod yn wahanol a gall ddibynnu ar y datganiad problem, sydd, yn ei dro, yn cael ei bennu gan nodau busnes. Felly, er mwyn deall pa ddull sy'n well, fe wnaethom hyfforddi dau fodel:

  1. Dull dosbarthu deuaidd a ddefnyddir yn gyffredin gan ddefnyddio algorithm dysgu peiriant coeden benderfynu ensemble (GolauGBM);
  2. Model Weibull-LSTM

Roedd y set brawf yn cynnwys 500 o gleientiaid a ddewiswyd ymlaen llaw nad oeddent yn y set hyfforddi. Dewiswyd hyper-baramedrau ar gyfer y model gan ddefnyddio traws-ddilysiad, wedi'u dadansoddi fesul cleient. Defnyddiwyd yr un setiau o nodweddion i hyfforddi pob model.

Oherwydd y ffaith nad oes gan y model gof, cymerwyd nodweddion arbennig ar ei gyfer, gan ddangos y gymhareb o newidiadau mewn paramedrau am fis i'r gwerth cyfartalog ar gyfer paramedrau dros y tri mis diwethaf. Beth oedd yn nodweddu cyfradd y newid mewn gwerthoedd dros y cyfnod diwethaf o dri mis. Heb hyn, byddai'r model wedi'i seilio ar Goedwig ar Hap o dan anfantais o gymharu â Weibull-LSTM.

Pam mae LSTM gyda dosbarthiad Weibull yn well na dull coeden benderfynu ensemble

Mae popeth yn glir yma mewn dim ond cwpl o luniau.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Cymhariaeth o Lift Curve ar gyfer yr algorithm clasurol a Weibull-LSTM

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Cymharu metrig y Lift Curve fesul mis ar gyfer yr algorithm clasurol a Weibull-LSTM

Yn gyffredinol, mae LSTM yn well na'r algorithm clasurol ym mron pob achos.

Rhagfynegiad corddi

Gall model sy'n seiliedig ar rwydwaith niwral cylchol gyda chelloedd LSTM gyda dosbarthiad Weibull ragfynegi corddi ymlaen llaw, er enghraifft, rhagweld corddi cwsmeriaid o fewn y n mis nesaf. Ystyriwch yr achos dros n = 3. Yn yr achos hwn, ar gyfer pob mis, rhaid i'r rhwydwaith niwral benderfynu'n gywir a fydd y cleient yn gadael, gan ddechrau o'r mis nesaf a hyd at y nfed mis. Mewn geiriau eraill, rhaid iddo benderfynu'n gywir a fydd y cwsmer yn aros ar ôl n mis. Gellir ystyried hyn yn rhagolwg ymlaen llaw: rhagweld y foment pan oedd y cleient newydd ddechrau meddwl am adael.

Gadewch i ni gymharu Lift Curve ar gyfer Weibull-LSTM 1, 2 a 3 mis cyn yr all-lif:

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Rydym eisoes wedi ysgrifennu uchod bod y rhagolygon a wnaed ar gyfer cleientiaid nad ydynt bellach yn weithgar ers peth amser hefyd yn bwysig. Felly, yma byddwn yn ychwanegu at y sampl achosion o'r fath pan fo'r cwsmer ymadawedig eisoes wedi bod yn segur ers mis neu ddau, ac yn gwirio bod Weibull-LSTM yn dosbarthu achosion o'r fath yn gorddi yn gywir. Gan fod achosion o’r fath yn bresennol yn y sampl, disgwyliwn i’r rhwydwaith ymdrin â nhw’n dda:

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Cadw cwsmeriaid

A dweud y gwir, dyma'r prif beth y gellir ei wneud, cael mewn llaw gwybodaeth bod cleientiaid o'r fath ac o'r fath yn paratoi i roi'r gorau i ddefnyddio'r cynnyrch. Wrth siarad am adeiladu model a allai gynnig rhywbeth defnyddiol i gwsmeriaid er mwyn eu cadw, ni ellir gwneud hyn os nad oes gennych hanes o ymdrechion tebyg a fyddai'n dod i ben yn dda.

Nid oedd gennym y fath stori, felly fe benderfynon ni fel hyn.

  1. Rydym yn adeiladu model sy'n nodi cynhyrchion diddorol ar gyfer pob cleient.
  2. Bob mis rydym yn rhedeg y dosbarthwr ac yn nodi cwsmeriaid a allai adael.
  3. Rydym yn cynnig y cynnyrch i rai cleientiaid, yn ôl y model o bwynt 1, a chofiwch ein gweithredoedd.
  4. Ar ôl ychydig fisoedd, edrychwn ar ba rai o'r rhain a allai adael cleientiaid ar ôl a pha rai sydd ar ôl. Felly, rydym yn ffurfio sampl hyfforddi.
  5. Rydym yn hyfforddi'r model gan ddefnyddio'r hanes a gafwyd yng ngham 4.
  6. Yn ddewisol, rydym yn ailadrodd y weithdrefn, gan ddisodli'r model o gam 1 gyda'r model a gafwyd yng ngham 5.

Gellir cynnal prawf o ansawdd cadw o'r fath trwy brofion A/B rheolaidd - rydym yn rhannu cwsmeriaid a allai adael yn ddau grŵp. Rydym yn cynnig cynnyrch i un yn seiliedig ar ein model cadw, ac i'r llall nid ydym yn cynnig dim. Fe wnaethom benderfynu hyfforddi model a allai fod yn ddefnyddiol eisoes ym mhwynt 1 o'n hesiampl.

Roeddem am wneud y segmentiad mor ddehongliadwy â phosibl. I wneud hyn, fe wnaethom ddewis nifer o nodweddion y gellid eu dehongli'n hawdd: cyfanswm nifer y trafodion, cyflogau, cyfanswm trosiant cyfrif, oedran, rhyw. Nid oedd nodweddion o’r tabl “Mapiau” yn cael eu hystyried fel rhai anwybodus, ac ni ystyriwyd nodweddion o dabl 3 “Contractau” oherwydd cymhlethdod y prosesu er mwyn osgoi gollyngiad data rhwng y set ddilysu a’r set hyfforddi.

Cyflawnwyd clystyru gan ddefnyddio modelau cymysgedd Gaussian. Roedd maen prawf gwybodaeth Akaike yn ein galluogi i bennu 2 optima. Mae'r optimwm cyntaf yn cyfateb i 1 clwstwr. Mae'r ail optimwm, llai amlwg, yn cyfateb i 80 o glystyrau. Yn seiliedig ar y canlyniad hwn, gallwn ddod i'r casgliad a ganlyn: mae'n anodd iawn rhannu data yn glystyrau heb wybodaeth a priori. Er mwyn clystyru'n well, mae angen data arnoch sy'n disgrifio pob cleient yn fanwl.

Felly, ystyriwyd problem dysgu dan oruchwyliaeth er mwyn cynnig cynnyrch gwahanol i bob cleient unigol. Ystyriwyd y cynhyrchion canlynol: “Blaendal tymor”, “Cerdyn credyd”, “Gorddrafft”, “Benthyciad defnyddwyr”, “Benthyciad car”, “Mortgage”.

Roedd y data yn cynnwys un math arall o gynnyrch: “Cyfrif cyfredol”. Ond ni wnaethom ei ystyried oherwydd ei gynnwys gwybodaeth isel. Ar gyfer defnyddwyr sy'n gleientiaid banc, h.y. heb roi'r gorau i ddefnyddio ei gynhyrchion, lluniwyd model i ragweld pa gynnyrch a allai fod o ddiddordeb iddynt. Dewiswyd atchweliad logistaidd fel y model, a defnyddiwyd y gwerth Lifft ar gyfer y 10 canradd cyntaf fel y metrig asesu ansawdd.

Gellir asesu ansawdd y model yn y ffigwr.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol
Canlyniadau model argymhelliad cynnyrch i gwsmeriaid

Cyfanswm

Daeth y dull hwn â ni yn gyntaf yn y categori “AI mewn Banciau” ym Mhencampwriaeth AI RAIF-Her 2017.

Sut roedden ni'n rhagweld corddi trwy fynd ato fel trychineb naturiol

Yn ôl pob tebyg, y prif beth oedd mynd at y broblem o ongl anghonfensiynol a defnyddio dull a ddefnyddir fel arfer ar gyfer sefyllfaoedd eraill.

Er y gall all-lif enfawr o ddefnyddwyr fod yn drychineb naturiol i wasanaethau.

Gellir cymryd y dull hwn i ystyriaeth ar gyfer unrhyw faes arall lle mae'n bwysig ystyried all-lif, nid banciau yn unig. Er enghraifft, fe'i defnyddiwyd i gyfrifo ein hall-lif ein hunain - yng nghanghennau Siberia a St Petersburg o Rostelecom.

"Labordy Mwyngloddio Data" cwmni "Porth Chwilio "Sputnik"

Ffynhonnell: hab.com

Ychwanegu sylw