Monitorim + testim i ngarkesës = parashikim dhe pa dështime

Departamenti i IT VTB disa herë duhej të merrej me situata emergjente në funksionimin e sistemeve, kur ngarkesa mbi to u rrit shumë herë. Prandaj, ekzistonte nevoja për të zhvilluar dhe testuar një model që do të parashikonte ngarkesën maksimale në sistemet kritike. Për ta bërë këtë, specialistët e IT të bankës ngritën monitorimin, analizuan të dhënat dhe mësuan të automatizojnë parashikimet. Ne do t'ju tregojmë në një artikull të shkurtër se cilat mjete ndihmuan në parashikimin e ngarkesës dhe nëse ato ndihmuan në optimizimin e punës.

Monitorim + testim i ngarkesës = parashikim dhe pa dështime

Problemet me shërbimet me ngarkesë të lartë lindin pothuajse në të gjitha industritë, por për sektorin financiar ato janë kritike. Në orën X, të gjitha njësitë luftarake duhet të jenë gati, dhe për këtë arsye ishte e nevojshme të dihej paraprakisht se çfarë mund të ndodhte dhe madje të përcaktohej dita kur ngarkesa do të hidhej dhe cilat sisteme do ta hasnin. Dështimet duhet të trajtohen dhe të parandalohen, kështu që nevoja për të zbatuar një sistem analitik parashikues as që u diskutua. Ishte i nevojshëm modernizimi i sistemeve bazuar në të dhënat e monitorimit.

Analiza në gjunjë

Projekti i listës së pagave është një nga më të ndjeshëm në rast dështimi. Është më e kuptueshme për parashikim, ndaj vendosëm të fillojmë me të. Për shkak të lidhjes së lartë, nënsistemet e tjera, duke përfshirë shërbimet bankare në distancë (RBS), mund të kenë probleme në momentet e ngarkesave maksimale. Për shembull, klientët që ishin të kënaqur me SMS për marrjen e parave filluan ta përdorin atë në mënyrë aktive. Ngarkesa mund të kërcejë me më shumë se një rend i madhësisë. 

Modeli i parë i parashikimit u krijua me dorë. Ne morëm ngarkimet për vitin e kaluar dhe llogaritëm se në cilat ditë priten maksimumin: për shembull, 1, 15 dhe 25, si dhe në ditët e fundit të muajit. Ky model kërkonte kosto të konsiderueshme të punës dhe nuk jepte një parashikim të saktë. Sidoqoftë, ai identifikoi pengesat ku ishte e nevojshme të shtohej hardueri dhe bëri të mundur optimizimin e procesit të transferimit të parave duke rënë dakord me klientët spirancë: për të mos dhënë pagat në një gllënjkë, transaksionet nga rajone të ndryshme u shpërndanë me kalimin e kohës. Tani ne i përpunojmë ato në pjesë që infrastruktura IT e bankës mund t'i "përtypë" pa dështim.

Pasi morëm rezultatin e parë pozitiv, kaluam në automatizimin e parashikimeve. Një duzinë zona të tjera kritike prisnin radhën.

Qasje e integruar

VTB ka implementuar një sistem monitorimi nga MicroFocus. Nga atje morëm mbledhjen e të dhënave për parashikim, një sistem ruajtjeje dhe një sistem raportimi. Në fakt, monitorimi ishte tashmë në vend, gjithçka që mbetej ishte shtimi i metrikës, një modul parashikimi dhe krijimi i raporteve të reja. Ky vendim mbështetet nga kontraktori i jashtëm Technoserv, kështu që puna kryesore për zbatimin e projektit ra mbi specialistët e tij, por ne vetë e ndërtuam modelin. Sistemi i parashikimit është bërë bazuar në Profetin, një produkt me kod të hapur i zhvilluar nga Facebook. Është i lehtë për t'u përdorur dhe integrohet lehtësisht me mjetet tona të instaluara të monitorimit të integruar dhe Vertica. Përafërsisht, sistemi analizon grafikun e ngarkesës dhe e ekstrapolon atë bazuar në seritë Fourier. Është gjithashtu e mundur të shtohen koeficientë të caktuar në ditë, të marra nga modeli ynë. Metrikat merren pa ndërhyrje njerëzore, parashikimi rillogaritet automatikisht një herë në javë dhe raportet e reja u dërgohen marrësve. 

Kjo qasje identifikon ciklikat kryesore, për shembull, vjetore, mujore, tremujore dhe javore. Pagesat e pagave dhe paradhënieve, periudhat e pushimeve, pushimet dhe shitjet - e gjithë kjo ndikon në numrin e thirrjeve në sisteme. Doli, për shembull, se disa cikle mbivendosen me njëri-tjetrin, dhe ngarkesa kryesore (75%) në sisteme vjen nga Qarku Federal Qendror. Personat juridikë dhe individët sillen ndryshe. Nëse ngarkesa nga "fizianët" shpërndahet relativisht në mënyrë të barabartë gjatë ditëve të javës (kjo është shumë transaksione të vogla), atëherë për kompanitë 99,9% shpenzohet në orët e punës, dhe transaksionet mund të jenë të shkurtra ose mund të përpunohen brenda disa minuta apo edhe orë.

Monitorim + testim i ngarkesës = parashikim dhe pa dështime

Bazuar në të dhënat e marra, përcaktohen tendencat afatgjata. Sistemi i ri ka zbuluar se njerëzit po lëvizin masivisht drejt shërbimeve bankare në distancë. Të gjithë e dinë këtë, por ne nuk e prisnim një shkallë të tillë dhe në fillim nuk besuam në të: numri i thirrjeve në zyrat e bankave po zvogëlohet jashtëzakonisht shpejt, dhe numri i transaksioneve në distancë po rritet saktësisht me të njëjtën sasi. Prandaj, ngarkesa në sisteme gjithashtu po rritet dhe do të vazhdojë të rritet. Tani po parashikojmë ngarkesën deri në shkurt 2020. Ditët normale mund të parashikohen me një gabim prej 3%, dhe ditët e pikut me një gabim prej 10%. Ky është një rezultat i mirë.

Grackë

Si zakonisht, kjo nuk ishte pa vështirësi. Mekanizmi i ekstrapolimit duke përdorur seritë Fourier nuk e kalon mirë zero - ne e dimë që personat juridikë gjenerojnë pak transaksione në fundjavë, por moduli i parashikimit prodhon vlera që janë larg zeros. Ishte e mundur të korrigjoheshin me forcë, por paterica nuk është metoda jonë. Përveç kësaj, ne duhej të zgjidhnim problemin e marrjes pa dhimbje të të dhënave nga sistemet burimore. Mbledhja e rregullt e informacionit kërkon burime serioze kompjuterike, kështu që ne ndërtuam memorie të shpejta duke përdorur përsëritje dhe marrim të dhëna biznesi nga kopjet. Mungesa e ngarkesës shtesë në sistemet kryesore në raste të tilla është një kërkesë bllokuese.

Sfida të reja

Detyra e drejtpërdrejtë e parashikimit të majave u zgjidh: nuk ka pasur dështime të lidhura me mbingarkesën në bankë që nga maji i këtij viti dhe sistemi i ri i parashikimit luajti një rol të rëndësishëm në këtë. Po, doli se nuk ishte e mjaftueshme, dhe tani banka dëshiron të kuptojë se sa të rrezikshme janë majat për të. Ne kemi nevojë për parashikime duke përdorur metrikë nga testimi i ngarkesës, dhe për rreth 30% të sistemeve kritike kjo tashmë funksionon, pjesa tjetër janë në proces të marrjes së parashikimeve. Në fazën tjetër, ne do të parashikojmë ngarkesën e sistemeve jo në transaksionet e biznesit, por në aspektin e infrastrukturës së TI-së, pra do të zbresim një shtresë. Përveç kësaj, ne duhet të automatizojmë plotësisht mbledhjen e metrikës dhe ndërtimin e parashikimeve bazuar në to, në mënyrë që të mos merremi me shkarkime. Nuk ka asgjë të mrekullueshme për këtë - ne thjesht po kalojmë monitorimin dhe testimin e ngarkesës në përputhje me praktikat më të mira globale.

Burimi: www.habr.com

Shto një koment