Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

Aig amannan, gus fuasgladh fhaighinn air duilgheadas, feumaidh tu dìreach coimhead air bho cheàrn eadar-dhealaichte. Fiù ma chaidh duilgheadasan co-chosmhail fhuasgladh anns na 10 bliadhna a dh’ fhalbh san aon dòigh le diofar bhuaidhean, chan eil e na fhìrinn gur e an dòigh seo an aon fhear.

Tha leithid de chuspair ann ri maistreadh teachdaiche. Tha an rud do-sheachanta, oir faodaidh luchd-ceannach companaidh sam bith, airson iomadach adhbhar, stad a chuir air na toraidhean no na seirbheisean aca a chleachdadh. Gu dearbh, airson companaidh, tha maistreadh na ghnìomh nàdarra, ach chan e an gnìomh as ion-mhiannaichte, agus mar sin bidh a h-uile duine a ’feuchainn ris a’ chnap-starra seo a lughdachadh. Nas fheàrr fhathast, dèan ro-innse air coltachd maistreadh airson roinn sònraichte de luchd-cleachdaidh, no neach-cleachdaidh sònraichte, agus mol cuid de cheumannan gus an cumail.

Tha e riatanach sgrùdadh a dhèanamh agus feuchainn ris an neach-dèiligidh a chumail, ma ghabhas e dèanamh, airson na h-adhbharan a leanas co-dhiù:

  • tha tàladh luchd-ceannach ùr nas daoire na modhan glèidhidh. Gus luchd-ceannach ùr a thàladh, mar riaghailt, feumaidh tu beagan airgid a chosg (sanasachd), fhad ‘s as urrainn do luchd-ceannach gnàthach a bhith air an cur an gnìomh le tairgse sònraichte le cumhachan sònraichte;
  • Tha tuigse air na h-adhbharan airson gum fàg luchd-ceannach na phrìomh dhòigh air toraidhean agus seirbheisean a leasachadh.

Tha dòighean àbhaisteach ann airson ro-innse maistreadh. Ach aig aon de na farpaisean AI, chuir sinn romhainn feuchainn air cuairteachadh Weibull airson seo. Tha e air a chleachdadh gu tric airson mion-sgrùdadh mairsinneachd, ro-aithris na sìde, mion-sgrùdadh mòr-thubaist nàdurrach, innleadaireachd gnìomhachais agus an leithid. Tha cuairteachadh Weibull na ghnìomh cuairteachaidh sònraichte le paramadair le dà pharamadair Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach и Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
Uicipeid

San fharsaingeachd, is e rud inntinneach a th’ ann, ach airson ro-innse air sruthan a-mach, agus ann an fintech san fharsaingeachd, chan eilear ga chleachdadh cho tric. Fon gearradh innsidh sinn dhut mar a rinn sinn (Data Mining Laboratory) seo, a’ cosnadh òr aig an aon àm aig Farpais Artificial Intelligence anns an roinn “AI in Banks”.

Mu chraicionn san fharsaingeachd

Tuigidh sinn beagan mu dè a th’ ann am maistreadh teachdaiche agus carson a tha e cho cudromach. Tha bunait luchd-ceannach cudromach airson gnìomhachas. Bidh luchd-ceannach ùr a ’tighinn chun bhunait seo, mar eisimpleir, às deidh dhaibh ionnsachadh mu thoraidhean no seirbheis bho sanas, a’ fuireach airson ùine (cleachd am bathar gu gnìomhach) agus às deidh beagan ùine stad air a chleachdadh. Canar “Customer Lifecycle” ris an ùine seo - teirm a tha a’ toirt cunntas air na h-ìrean a thèid neach-ceannach troimhe nuair a bhios e ag ionnsachadh mu dheidhinn toradh, a’ dèanamh co-dhùnadh ceannach, a’ pàigheadh, a’ cleachdadh agus a’ fàs na neach-cleachdaidh dìleas, agus aig a’ cheann thall a’ stad a bhith a’ cleachdadh an toraidh. air adhbhar no dhà. A rèir sin, is e maistreadh an ìre mu dheireadh de chuairt-beatha an neach-dèiligidh, nuair a stadas an neach-dèiligidh a’ cleachdadh nan seirbheisean, agus airson gnìomhachas tha seo a’ ciallachadh gu bheil an neach-dèiligidh air sgur a bhith a’ toirt prothaid no buannachd sam bith idir.

Tha gach neach-dèiligidh banca na neach sònraichte a thaghas cairt banca no tè eile gu sònraichte airson na feumalachdan aige. Ma bhios tu a’ siubhal gu tric, thig cairt le mìltean gu feum. Ceannaich tòrr - hello, cairt airgead air ais. Bidh e a 'ceannach mòran ann an stòran sònraichte - agus tha plastaig com-pàirtiche sònraichte ann mar-thà airson seo. Gu dearbh, uaireannan thèid cairt a thaghadh a rèir an t-slat-tomhais “Seirbheis as saoire”. San fharsaingeachd, tha caochladairean gu leòr an seo.

Agus bidh neach cuideachd a 'taghadh a' bhanca fhèin - a bheil feum sam bith ann a bhith a 'taghadh cairt bho bhanca aig a bheil meuran a-mhàin ann am Moscow agus an sgìre, nuair a tha thu à Khabarovsk? Fiù ma tha cairt bho leithid de bhanca co-dhiù 2 uair nas prothaidiche, tha làthaireachd mheuran banca faisg air làimh fhathast na shlat-tomhais cudromach. Tha, tha 2019 mar-thà an seo agus is e didseatach a h-uile dad a th’ againn, ach chan urrainnear grunn chùisean le cuid de bhancaichean fhuasgladh ach ann am meur. A bharrachd air an sin, a-rithist, tha earbsa aig cuid den t-sluagh ann am banca corporra mòran a bharrachd air tagradh air fòn cliste, feumar seo a thoirt fa-near cuideachd.

Mar thoradh air an sin, is dòcha gum bi mòran adhbharan aig neach airson a bhith a 'diùltadh bathar banca (no am banca fhèin). Dh'atharraich mi obraichean, agus dh'atharraich an targaid cairt bho thuarastal gu "For mere mortals", rud nach eil cho prothaideach. Ghluais mi gu baile-mòr eile far nach eil meuran banca ann. Cha bu toil leam an eadar-obrachadh leis a’ ghnìomhaiche gun teisteanas aig a’ mheur. Is e sin, is dòcha gu bheil eadhon barrachd adhbharan ann airson cunntas a dhùnadh na bhith a’ cleachdadh an toraidh.

Agus chan urrainn don neach-dèiligidh a-mhàin a rùn a chuir an cèill gu soilleir - thig chun bhanca agus sgrìobh aithris, ach dìreach stad air a bhith a ’cleachdadh a’ bhathar gun a bhith a ’crìochnachadh a’ chùmhnant. Chaidh co-dhùnadh ionnsachadh inneal agus AI a chleachdadh gus na duilgheadasan sin a thuigsinn.

A bharrachd air an sin, faodaidh maistreadh teachdaiche tachairt ann an gnìomhachas sam bith (telecom, solaraichean eadar-lìn, companaidhean àrachais, san fharsaingeachd, ge bith càite a bheil bunait teachdaiche agus gnothaichean bho àm gu àm).

Dè a rinn sinn

An toiseach, bha e riatanach cunntas a thoirt air crìoch shoilleir - bhon àm a thòisicheas sinn a 'beachdachadh air an neach-dèiligidh a dh' fhalbh. Bho thaobh a 'bhanca a thug dhuinn an dàta airson ar n-obair, bha inbhe gnìomhachd an neach-dèiligidh dà-chànanach - tha e gnìomhach no nach eil. Bha bratach ACTIVE_FLAG sa chlàr "Gnìomh", agus dh'fhaodadh an luach a bhith "0" no "1" ("Neo-ghnìomhach" agus "Gnìomhach") fa leth. Agus bhiodh a h-uile dad gu math, ach tha neach cho mòr is gun urrainn dha a chleachdadh gu gnìomhach airson ùine, agus an uairsin tuiteam a-mach às an liosta ghnìomhach airson mìos - dh ’fhàs e tinn, chaidh e gu dùthaich eile air saor-làithean, no eadhon chaidh e gu deuchainn a cairt bho bhanca eile. No is dòcha às deidh ùine fhada de neo-ghnìomhachd, tòisich a ’cleachdadh seirbheisean a’ bhanca a-rithist

Mar sin, chuir sinn romhainn ùine de neo-ghnìomhachd a ghairm mar ùine leantainneach sònraichte nuair a chaidh a’ bhratach a shuidheachadh gu “0”.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

Bidh teachdaichean a’ gluasad bho neo-ghnìomhach gu gnìomhach às deidh amannan neo-ghnìomhachd de dhiofar fhaid. Tha an cothrom againn obrachadh a-mach an ìre de luach empirigeach “earbsachd amannan neo-ghnìomhachd” - is e sin, an coltachd gun tòisich neach a’ cleachdadh toraidhean banca a-rithist às deidh neo-ghnìomhachd sealach.

Mar eisimpleir, tha an graf seo a’ sealltainn ath-thòiseachadh gnìomhachd (ACTIVE_FLAG = 1) de luchd-dèiligidh às deidh grunn mhìosan de neo-ghnìomhachd (ACTIVE_FLAG = 0).

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

An seo mìnichidh sinn beagan den t-seata dàta leis an do thòisich sinn ag obair. Mar sin, thug am banca seachad fiosrachadh iomlan airson 19 mìosan anns na clàran a leanas:

  • “Gnìomh” - gnothaichean teachdaiche mìosail (le cairtean, ann am bancaireachd eadar-lìn agus bancaireachd gluasadach), a’ toirt a-steach pàigheadh ​​​​agus fiosrachadh mu thionndadh.
  • “Cairtean” - dàta mu dheidhinn a h-uile cairt a tha aig an neach-dèiligidh, le clàr prìsean mionaideach.
  • “Cùmhnantan” - fiosrachadh mu aontaidhean an neach-dèiligidh (an dà chuid fosgailte agus dùinte): iasadan, tasgaidhean, msaa, a’ comharrachadh crìochan gach fear.
  • “Luchd-ceannach” - seata de dhàta deamografach (gnè agus aois) agus cothrom air fiosrachadh conaltraidh.

Airson obair bha feum againn air na bùird gu lèir ach a-mhàin am “Mapa”.

Bha duilgheadas eile ann an seo - anns an dàta seo cha do dh'ainmich am banca dè an seòrsa gnìomhachd a thachair air na cairtean. Is e sin, b 'urrainn dhuinn tuigsinn an robh gnothaichean ann no nach robh, ach cha b' urrainn dhuinn an seòrsa aca a dhearbhadh tuilleadh. Mar sin, cha robh e soilleir an robh an neach-dèiligidh a 'tarraing airgead air ais, a' faighinn tuarastal, no a 'cosg an airgid air ceannach. Cha robh dàta againn cuideachd mu chothromachadh cunntais, a bhiodh air a bhith feumail.

Bha an sampall fhèin neo-phàirteach - anns an sampall seo, thairis air 19 mìosan, cha do rinn am banca oidhirp sam bith gus luchd-ceannach a chumail agus às-sruthadh a lughdachadh.

Mar sin, mu amannan neo-ghnìomhachd.

Gus mìneachadh a dhèanamh air maistreadh, feumar ùine neo-ghnìomhachd a thaghadh. Gus ro-shealladh maistreadh a chruthachadh aig àm sònraichte Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach, feumaidh eachdraidh teachdaiche a bhith agad co-dhiù 3 mìosan aig àm sam bith Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach. Bha an eachdraidh againn cuingealaichte ri 19 mìosan, agus mar sin chuir sinn romhainn ùine neo-ghnìomhachd de 6 mìosan a ghabhail, ma tha sin ri fhaighinn. Agus airson an ùine as ìsle airson ro-shealladh àrd-inbhe, thug sinn 3 mìosan. Ghabh sinn na figearan airson 3 agus 6 mìosan gu empirigeach stèidhichte air mion-sgrùdadh air giùlan dàta teachdaiche.

Chuir sinn ri chèile am mìneachadh air maistreadh mar a leanas: mìos maistreadh teachdaiche Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach 'S e seo a' chiad mhìos le ACTIVE_FLAG=0, far bhon mhìos seo tha co-dhiù sia neoni leantainneach anns an raon ACTIVE_FLAG, ann am faclan eile, a' mhìos bhon robh an neach-dèiligidh neo-ghnìomhach airson 6 mìosan.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
An àireamh de luchd-dèiligidh a dh'fhalbh

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
An àireamh de luchd-dèiligidh a tha air fhàgail

Ciamar a tha an àireamhachadh air a mheas?

Ann an leithid de cho-fharpaisean, agus ann an cleachdadh san fharsaingeachd, thathas gu tric a’ ro-innse às-sruthadh san dòigh seo. Bidh an neach-dèiligidh a’ cleachdadh thoraidhean agus sheirbheisean aig diofar amannan, tha dàta air eadar-obrachadh leis air a riochdachadh mar vectar de fheartan fad stèidhichte n. Mar as trice tha am fiosrachadh seo a’ toirt a-steach:

  • Dàta a’ comharrachadh an neach-cleachdaidh (dàta deamografach, roinn margaidheachd).
  • Eachdraidh cleachdadh thoraidhean is sheirbheisean bancaidh (is iad sin gnìomhan teachdaiche a tha an-còmhnaidh ceangailte ri ùine sònraichte no ùine den ùine a dh’ fheumas sinn).
  • Taobh a-muigh dàta, ma bha e comasach fhaighinn - mar eisimpleir, lèirmheasan bho lìonraidhean sòisealta.

Agus às deidh sin, gheibh iad mìneachadh air maistreadh, eadar-dhealaichte airson gach gnìomh. An uairsin bidh iad a’ cleachdadh algairim ionnsachaidh inneal, a tha a’ ro-innse an coltas gum fàg neach-dèiligidh Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach stèidhichte air vector factaran Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach. Gus an algairim a thrèanadh, thathas a’ cleachdadh aon de na frèaman ainmeil airson a bhith a’ togail ensembles de chraobhan co-dhùnaidh, XGB àrdachadh, SolasGBM, CatBoost no atharrachaidhean air.

Chan eil an algairim fhèin dona, ach tha grunn dhroch eas-bhuannachdan ann nuair a thig e gu bhith a’ ro-innse maistreadh.

  • Chan eil “cuimhne” aige ris an canar. Is e cuir a-steach a’ mhodail àireamh shònraichte de fheartan a tha a rèir na h-ùine a th’ ann an-dràsta. Gus fiosrachadh a stòradh mu eachdraidh atharrachaidhean ann am paramadairean, feumar obrachadh a-mach feartan sònraichte a tha a 'comharrachadh atharrachaidhean ann am paramadairean thar ùine, mar eisimpleir, an àireamh no an àireamh de ghnothaichean banca thairis air na 1,2,3, XNUMX, XNUMX mìosan mu dheireadh. Chan urrainn don dòigh-obrach seo ach gu ìre nochdadh nàdar atharrachaidhean sealach.
  • Fìrinn ro-innse stèidhichte. Chan urrainn don mhodail ach maistreadh teachdaiche a ro-innse airson ùine ro-mhìnichte, mar eisimpleir, ro-aithris mìos ro làimh. Ma tha feum air ro-aithris airson ùine eadar-dhealaichte, mar eisimpleir, trì mìosan, feumaidh tu an seata trèanaidh ath-thogail agus modal ùr ath-thrèanadh.

An dòigh-obrach againn

Cho-dhùin sinn sa bhad nach cleachdadh sinn dòighean àbhaisteach. A bharrachd oirnne, chlàraich 497 barrachd dhaoine san fharpais, agus bha eòlas mòr aig gach fear dhiubh air an cùlaibh. Mar sin chan e deagh bheachd a th’ ann a bhith a’ feuchainn ri rudeigin a dhèanamh a rèir sgeama àbhaisteach ann an leithid de shuidheachaidhean.

Agus thòisich sinn air fuasgladh fhaighinn air na duilgheadasan a tha mu choinneamh a’ mhodail seòrsachaidh binary le bhith a’ ro-innse cuairteachadh coltachd amannan maistreadh teachdaiche. Tha dòigh-obrach coltach ris ri fhaicinn an seo, leigidh e leat maistreadh a ro-innse ann an dòigh nas sùbailte agus deuchainn a dhèanamh air barailean nas iom-fhillte na anns an dòigh clasaigeach. Mar theaghlach de sgaoilidhean a’ modail an ùine às-srutha, thagh sinn an cuairteachadh Weibull airson a chleachdadh fad is farsaing ann an mion-sgrùdadh mairsinn. Faodar giùlan an neach-dèiligidh fhaicinn mar sheòrsa de bhith beò.

Seo eisimpleirean de sgaoilidhean dùmhlachd coltachd Weibull a rèir paramadairean Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach и Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach:

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

Is e seo an gnìomh dùmhlachd coltachd gum bi triùir luchd-ceannach eadar-dhealaichte a’ maistreadh thar ùine. Tha ùine air a thaisbeanadh ann am mìosan. Ann am faclan eile, tha an graf seo a 'sealltainn cuin a tha neach-dèiligidh nas buailtiche maistreadh anns an ath dhà mhìos. (2) sgaoilidhean.

Is e an toradh modail a tha, airson gach neach-dèiligidh, airson a h-uile duine
mìos a’ ro-innse crìochan cuairteachadh Weibull, a tha a’ nochdadh as fheàrr a thaobh coltachd às-sruthadh thar ùine. Nas mionaidiche:

  • Is e na feartan targaid air an t-seata trèanaidh an ùine a tha air fhàgail gus an tèid maistreadh ann am mìos sònraichte airson neach-dèiligidh sònraichte.
  • Mura h-eil ìre maistreadh ann airson neach-ceannach, tha sinn a’ gabhail ris gu bheil an ùine maistreadh nas motha na an àireamh de mhìosan bhon mhìos seo gu deireadh na h-eachdraidh a th’ againn.
  • Modail air a chleachdadh: lìonra neural ath-chuairteach le còmhdach LSTM.
  • Mar ghnìomh call, bidh sinn a’ cleachdadh a’ ghnìomh àicheil coltach ri log airson cuairteachadh Weibull.

Seo na buannachdan a tha aig an dòigh seo:

  • Tha cuairteachadh coltachd, a bharrachd air a’ chomas follaiseach de sheòrsachadh binary, a’ ceadachadh ro-innse sùbailte air diofar thachartasan, mar eisimpleir, am bi neach-dèiligidh a’ stad a’ cleachdadh seirbheisean a’ bhanca taobh a-staigh 3 mìosan. Cuideachd, ma tha sin riatanach, faodar diofar mheatairean a chuibheasachadh thairis air an sgaoileadh seo.
  • Tha cuimhne aig lìonra neural ath-chuairteach LSTM agus bidh e gu h-èifeachdach a’ cleachdadh na h-eachdraidh gu lèir a tha ri fhaighinn. Mar a thèid an sgeulachd a leudachadh no ùrachadh, bidh cruinneas ag àrdachadh.
  • Faodar an dòigh-obrach a sgèileadh gu furasta nuair a bhios tu a’ roinn amannan ùine gu feadhainn nas lugha (mar eisimpleir, nuair a bhios tu a’ roinn mìosan gu seachdainean).

Ach chan eil e gu leòr airson deagh mhodail a chruthachadh; feumaidh tu cuideachd measadh ceart a dhèanamh air a chàileachd.

Ciamar a chaidh càileachd a mheas?

Thagh sinn Lift Curve mar an meatrach. Tha e air a chleachdadh ann an gnìomhachas airson a leithid de chùisean air sgàth a mhìneachadh soilleir, tha e air a mhìneachadh gu math an seo и an seo. Ma bheir thu cunntas air brìgh a’ mheatrach seo ann an aon seantans, bhiodh e “Cò mheud uair a nì an algairim an ro-innse as fheàrr sa chiad Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach% na air thuaiream."

Modailean trèanaidh

Cha do stèidhich cumhaichean na farpais meatrach càileachd sònraichte leis an urrainnear coimeas a dhèanamh eadar diofar mhodalan agus dhòighean-obrach. A bharrachd air an sin, faodaidh am mìneachadh air maistreadh a bhith eadar-dhealaichte agus faodaidh e a bhith an urra ris an aithris duilgheadas, a tha, an uair sin, air a dhearbhadh le amasan gnìomhachais. Mar sin, gus tuigsinn dè an dòigh a tha nas fheàrr, tha sinn air dà mhodail a thrèanadh:

  1. Dòigh-obrach seòrsachaidh binary air a chleachdadh gu cumanta a’ cleachdadh algorithm ionnsachaidh inneal craoibhe co-dhùnaidh ensemble (SolasGBM);
  2. Modail Weibull-LSTM

Anns an t-seata deuchainn bha 500 neach-dèiligidh ro-roghnaichte nach robh san t-seata trèanaidh. Chaidh hyper-parameters a thaghadh airson a’ mhodail a’ cleachdadh tar-dhearbhadh, air a bhriseadh sìos leis an neach-dèiligidh. Chaidh na h-aon sheata de fheartan a chleachdadh airson gach modail a thrèanadh.

Air sgàth 's nach eil cuimhne aig a' mhodail, chaidh feartan sònraichte a ghabhail air a shon, a 'sealltainn an co-mheas de dh'atharrachaidhean ann am paramadairean airson aon mhìos gu luach cuibheasach airson crìochan thairis air na trì mìosan a dh' fhalbh. Dè a chomharraich an ìre atharrachaidh ann an luachan thairis air an ùine mu dheireadh de thrì mìosan. Às aonais seo, bhiodh am modail stèidhichte air Random Forest fo ana-cothrom an coimeas ri Weibull-LSTM.

Carson a tha LSTM le cuairteachadh Weibull nas fheàrr na dòigh-obrach craobh co-dhùnaidh ensemble

Tha a h-uile dad soilleir an seo ann an dìreach dealbh no dhà.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
Coimeas eadar Lift Curve airson an algairim clasaigeach agus Weibull-LSTM

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
Coimeas eadar meatrach Lift Curve a rèir mìos airson an algairim clasaigeach agus Weibull-LSTM

San fharsaingeachd, tha LSTM nas fheàrr na an algairim clasaigeach anns cha mhòr a h-uile cùis.

Ro-shealladh crathaidh

Faodaidh modal stèidhichte air lìonra neural ath-chuairteach le ceallan LSTM le cuairteachadh Weibull ro-innse maistreadh ro-làimh, mar eisimpleir, ro-innse maistreadh teachdaiche taobh a-staigh na mìosan a tha romhainn. Beachdaich air a 'chùis airson n = 3. Anns a 'chùis seo, airson gach mìos, feumaidh an lìonra neural co-dhùnadh gu ceart am fàg an neach-dèiligidh, a' tòiseachadh bhon ath mhìos agus chun naoidheamh mìos. Ann am faclan eile, feumaidh e dearbhadh gu ceart am fuirich an neach-ceannach às deidh n mìosan. Faodar seo a mheas mar ro-aithris ro-làimh: ro-innse air a’ mhionaid nuair a bha an neach-dèiligidh dìreach a’ tòiseachadh a’ smaoineachadh air falbh.

Dèanamaid coimeas eadar Lift Curve airson Weibull-LSTM 1, 2 agus 3 mìosan ron às-sruthadh:

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

Tha sinn mu thràth air sgrìobhadh gu h-àrd gu bheil na ro-innsean a chaidh a dhèanamh airson teachdaichean nach eil gnìomhach airson ùine cudromach cuideachd. Mar sin, an seo cuiridh sinn ris an t-sampall a leithid de chùisean nuair a tha an neach-ceannach a dh ’fhalbh air a bhith neo-ghnìomhach mu thràth airson mìos no dhà, agus nì sinn cinnteach gu bheil Weibull-LSTM a’ seòrsachadh chùisean mar maistreadh gu ceart. Leis gu robh cùisean mar seo an làthair san sampall, tha sinn an dùil gun làimhsich an lìonra iad gu math:

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

Glèidheadh ​​​​luchd-ceannach

Gu fìrinneach, is e seo am prìomh rud a ghabhas dèanamh, le fiosrachadh na làimh gu bheil an leithid agus an leithid de luchd-dèiligidh ag ullachadh airson stad a chuir air cleachdadh an toraidh. A’ bruidhinn air modal a thogail a dh’ fhaodadh rudeigin feumail a thabhann do luchd-ceannach gus an cumail, chan urrainnear seo a dhèanamh mura h-eil eachdraidh agad air oidhirpean coltach ris a thigeadh gu crìch gu math.

Cha robh an leithid de sgeulachd againn, agus mar sin chuir sinn romhainn e mar seo.

  1. Tha sinn a’ togail modail a chomharraicheas toraidhean inntinneach airson gach neach-dèiligidh.
  2. Gach mìos bidh sinn a’ ruith an seòrsaiche agus a’ comharrachadh luchd-ceannach a dh’ fhaodadh a bhith a’ fàgail.
  3. Bidh sinn a 'tairgsinn an toradh do chuid de luchd-cleachdaidh, a rèir a' mhodail bho phuing 1, agus cuimhnich air na gnìomhan againn.
  4. An ceann beagan mhìosan, bidh sinn a 'coimhead air dè an fheadhainn a dh' fhaodadh a bhith a 'fàgail luchd-dèiligidh agus a dh' fhalbh. Mar sin, bidh sinn a’ cruthachadh sampall trèanaidh.
  5. Bidh sinn a’ trèanadh a’ mhodail a’ cleachdadh na h-eachdraidh a gheibhear ann an ceum 4.
  6. Roghainneil, bidh sinn ag ath-aithris a 'mhodh-obrachaidh, a' cur a 'mhodail a gheibhear ann an ceum 1 an àite a' mhodail bho cheum 5.

Faodar deuchainn air càileachd an leithid de ghleidheadh ​​​​a dhèanamh le deuchainn cunbhalach A/B - bidh sinn a’ roinn luchd-ceannach a dh’ fhaodadh a bhith air fhàgail ann an dà bhuidheann. Bidh sinn a’ tabhann thoraidhean gu aon stèidhichte air a’ mhodal gleidhidh againn, agus don fhear eile cha bhith sinn a’ tabhann dad. Chuir sinn romhainn modal a thrèanadh a dh’ fhaodadh a bhith feumail mu thràth aig puing 1 den eisimpleir againn.

Bha sinn airson an sgaradh a dhèanamh cho eadar-mhìneachadh sa ghabhas. Gus seo a dhèanamh, thagh sinn grunn fheartan a dh'fhaodar a mhìneachadh gu furasta: an àireamh iomlan de ghnothaichean, tuarastal, tionndadh cunntas iomlan, aois, gnè. Cha deach aire a thoirt do fheartan bhon chlàr “Maps” mar neo-fhiosrachadh, agus cha deach feartan bho chlàr 3 “Cùmhnantan” a ghabhail a-steach air sgàth cho iom-fhillte ‘s a bha an giollachd gus aodion dàta a sheachnadh eadar an seata dearbhaidh agus an seata trèanaidh.

Chaidh cruinneachadh a dhèanamh a’ cleachdadh mhodalan measgachadh Gaussian. Leig slat-tomhais fiosrachaidh Akaike leinn 2 optima a dhearbhadh. Tha a 'chiad optimum a' freagairt ri 1 brabhsair. Tha an dàrna fear as fheàrr, nach eil cho follaiseach, a’ freagairt ri 80 cruinneachaidhean. Stèidhichte air an toradh seo, is urrainn dhuinn an co-dhùnadh a leanas a tharraing: tha e air leth duilich dàta a roinn ann an cruinneachaidhean às aonais fiosrachadh a chaidh a thoirt seachad a priori. Airson cruinneachadh nas fheàrr, feumaidh tu dàta a bheir cunntas mionaideach air gach neach-dèiligidh.

Mar sin, chaidh beachdachadh air duilgheadas ionnsachadh fo stiùir gus toradh eadar-dhealaichte a thabhann do gach neach-dèiligidh. Chaidh beachdachadh air na toraidhean a leanas: “Tasgaidh teirm”, “Cairt creideis”, “Overdraft”, “Iasad luchd-cleachdaidh”, “Iasad càr”, “Mortgage”.

Bha an dàta a’ toirt a-steach aon sheòrsa toraidh eile: “Cunntas gnàthach”. Ach cha do bheachdaich sinn air air sgàth cho beag de shusbaint fiosrachaidh. Do luchd-cleachdaidh a tha nan teachdaichean banca, i.e. cha do sguir a bhith a’ cleachdadh a thoraidhean, chaidh modail a thogail gus ro-innse dè an toradh a bhiodh inntinneach dhaibh. Chaidh ais-tharraing loidsigeach a thaghadh mar mhodail, agus chaidh luach Lift airson a’ chiad 10 ceudadan a chleachdadh mar mheatrach measaidh càileachd.

Faodar càileachd a’ mhodail a mheasadh san fhigear.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach
Toraidhean modail moladh toraidh airson luchd-ceannach

An toradh

Thug an dòigh-obrach seo a’ chiad àite dhuinn san roinn “AI in Banks” aig Farpais AI RAIF-Challenge 2017.

Mar a bha sinn a’ ro-innse maistreadh le bhith a’ tighinn faisg air mar mhòr-thubaist nàdurrach

A rèir coltais, b 'e am prìomh rud a bhith a' dèiligeadh ris an duilgheadas bho cheàrn neo-ghnàthach agus a 'cleachdadh dòigh a tha mar as trice air a chleachdadh airson suidheachaidhean eile.

Ged a dh’ fhaodadh sruthadh mòr de luchd-cleachdaidh a bhith na mhòr-thubaist nàdurrach dha seirbheisean.

Faodar an dòigh seo a ghabhail a-steach airson raon sam bith eile far a bheil e cudromach aire a thoirt do às-sruthadh, chan e dìreach bancaichean. Mar eisimpleir, chleachd sinn e airson ar sruth-a-mach fhèin obrachadh a-mach - ann am meuran Siberia agus St Petersburg de Rostelecom.

Companaidh "Data Mining Laboratory" "Search portal "Sputnik"

Source: www.habr.com

Cuir beachd ann