Monitering + vragtoetsing = voorspelbaarheid en geen mislukkings nie

Die IT-afdeling van VTB moes verskeie kere noodsituasies in die bedryf van stelsels hanteer, wanneer die las daarop baie keer toegeneem het. Daarom het dit nodig geword om 'n model te ontwikkel en te toets wat die pieklas op kritieke stelsels sou voorspel. Om dit te doen, het die bank se IT-spesialiste monitering opgestel, die data ontleed en geleer hoe om voorspellings te outomatiseer. Watter gereedskap het gehelp om die vrag te voorspel en of dit moontlik was om die werk met hul hulp te optimaliseer, sal ons in 'n kort artikel vertel.

Monitering + vragtoetsing = voorspelbaarheid en geen mislukkings nie

Probleme met hoogs gelaaide dienste kom in byna alle bedrywe voor, maar dit is van kritieke belang vir die finansiële sektor. Op uur X moes alle gevegseenhede gereed wees, dus was dit nodig om vooraf te weet wat kan gebeur en selfs die dag te bepaal wanneer die vrag sou styg en watter stelsels dit sou trotseer. Mislukkings moet hanteer en voorkom word, so die behoefte om 'n voorspellende analitiese stelsel te implementeer is nie eers bespreek nie. Stelsels moes opgegradeer word op grond van moniteringsdata.

Analytics op die knie

’n Betaalstaatprojek is een van die sensitiefste in die geval van ’n mislukking. Dit is die mees verstaanbare vir voorspelling, so ons het besluit om daarmee te begin. As gevolg van die hoë konnektiwiteit in tye van piekladings, kan ander substelsels ook probleme ondervind, insluitend afgeleë bankdienste (RB). Kliënte wat byvoorbeeld verheug was oor SMS oor die ontvangs van geld, het dit aktief begin gebruik. In hierdie geval kan die vrag met meer as 'n orde van grootte spring. 

Die eerste voorspellingsmodel is met die hand geskep. Ons het die oplaai vir die laaste jaar geneem en bereken op watter dae die maksimum pieke verwag word: byvoorbeeld op die 1ste, 15de en 25ste, sowel as op die laaste dae van die maand. Hierdie model het ernstige arbeidskoste vereis en het nie 'n akkurate voorspelling gegee nie. Sy het nietemin knelpunte geïdentifiseer waar dit nodig was om "yster" by te voeg, en toegelaat om die proses van oordrag van geld te optimaliseer deur met ankerkliënte ooreen te kom: om nie salarisse "in een sluk" te gee nie, is transaksies uit verskillende streke oor tyd versprei. . Nou verwerk ons ​​dit in dele wat die bank se IT-infrastruktuur sonder mislukkings kan "kou".

Nadat ons die eerste positiewe uitslag ontvang het, het ons oorgegaan na die outomatisering van vooruitskatting. Nog 'n dosyn kritieke areas het op hul beurt gewag.

Geïntegreerde benadering

VTB het 'n moniteringstelsel van MicroFocus geïmplementeer. Van daar af het ons data-insameling vir vooruitskatting, 'n bergingstelsel en 'n verslagdoeningstelsel geneem. Trouens, daar was reeds monitering, dit het net oorgebly om metrieke by te voeg, 'n voorspellingsmodule en nuwe verslae te skep. Hierdie oplossing word ondersteun deur die eksterne kontrakteur Technoserv, so die hoofwerk aan die implementering van die projek het op sy spesialiste geval, maar ons het die model self gebou. Die voorspellingstelsel is gemaak op grond van Prophet - hierdie oop produk is deur Facebook ontwikkel. Dit is maklik om te gebruik en integreer maklik met ons geïntegreerde moniteringsinstrumente en Vertica. Rofweg gesproke ontleed die stelsel die laaiskedule en ekstrapoleer dit op grond van die Fourier-reeks. Dit is ook moontlik om 'n paar koëffisiënte by te voeg vir die dae wat uit ons model geneem is. Metrieke word geneem sonder menslike ingryping, een keer per week word die voorspelling outomaties herbereken, nuwe verslae word aan ontvangers gestuur. 

Hierdie benadering openbaar die hoofsiklusse, byvoorbeeld jaarliks, maandeliks, kwartaalliks en weekliks. Salarisse en vooruitbetalings, vakansietydperke, vakansiedae en verkope – dit alles beïnvloed die aantal oproepe na die stelsels. Dit het byvoorbeeld geblyk dat sommige siklusse mekaar oorvleuel, en die hooflading (75%) op die stelsels kom van die Sentrale Federale Distrik. Regspersone en individue tree anders op. As die las van die "fisici" relatief eweredig oor die dae van die week versprei is (daar is baie klein transaksies), dan het maatskappye 99,9% gedurende werksure, bowendien kan transaksies kort wees, of dit kan binne verwerk word etlike minute of selfs ure.

Monitering + vragtoetsing = voorspelbaarheid en geen mislukkings nie

Op grond van die data wat verkry is, word langtermynneigings bepaal. Die nuwe stelsel het aan die lig gebring dat mense massaal vertrek vir afgeleë bankdienste. Almal weet dit, maar ons het nie so 'n skaal verwag nie en ons het eers nie daarin geglo nie: die aantal oproepe na die bank se kantore neem uiters vinnig af, en die aantal afgeleë transaksies groei met presies dieselfde hoeveelheid. Gevolglik groei die las op die stelsels ook en sal dit aanhou groei. Ons voorspel nou die vrag tot Februarie 2020. Normale dae kan met 'n fout van 3% voorspel word, en spitsdae - met 'n fout van 10%. Dit is 'n goeie resultaat.

Slaggate

Soos gewoonlik was dit nie sonder probleme nie. Die ekstrapolasiemeganisme met behulp van Fourier-reekse kruis nie goed nul nie - ons weet dat regsentiteite min transaksies die naweek genereer, maar die voorspeller produseer waardes wat ver van nul is. Dit was moontlik om hulle met geweld reg te stel, maar krukke is nie ons metode nie. Boonop moes ons die probleem oplos van pynlose dataverwydering vanaf bronstelsels. Gereelde versameling van inligting vereis ernstige rekenaarhulpbronne, so ons het vinnige kass gebou deur replikasie te gebruik, ons kry besigheidsdata reeds van replikas. Die afwesigheid van bykomende las op die meesterstelsels in sulke gevalle is 'n blokkeringsvereiste.

Nuwe uitdagings

Die kop-aan-taak om pieke te voorspel is opgelos: daar was geen oorladingsverwante mislukkings in die bank sedert Mei vanjaar nie, en die nuwe vooruitskattingstelsel het 'n belangrike rol hierin gespeel. Ja, dit was nie genoeg nie, en nou wil die bank verstaan ​​hoe gevaarlik grawe daarvoor is. Ons benodig voorspellings wat metrieke van vragtoetsing gebruik, en vir ongeveer 30% van kritieke stelsels werk dit reeds, die res is in die proses om voorspellings te verkry. In die volgende stadium gaan ons die las op die stelsels voorspel, nie in besigheidstransaksies nie, maar in terme van IT-infrastruktuur, dit wil sê ons sal afgaan na die laag hieronder. Daarbenewens moet ons die versameling van statistieke en die konstruksie van voorspellings op grond daarvan ten volle outomatiseer, om nie die aflaai te hanteer nie. Daar is niks uitstaande hierin nie - ons kruis monitering en vragtoetsing net in ooreenstemming met die beste wêreldpraktyke.

Bron: will.com

Voeg 'n opmerking