UzraudzÄ«ba + slodzes pārbaude = prognozÄ“Å”ana un bez kļūmēm

VTB IT nodaļai vairākkārt nācies saskarties ar avārijas situācijām sistēmu darbÄ«bā, kad slodze uz tām pieauga daudzkārt. Tāpēc bija nepiecieÅ”ams izstrādāt un pārbaudÄ«t modeli, kas prognozētu kritisko sistēmu maksimālo slodzi. Lai to paveiktu, bankas IT speciālisti izveidoja monitoringu, analizēja datus un mācÄ«jās automatizēt prognozes. ÄŖsā rakstā pastāstÄ«sim, kuri rÄ«ki palÄ«dzēja prognozēt slodzi un vai tie palÄ«dzēja optimizēt darbu.

UzraudzÄ«ba + slodzes pārbaude = prognozÄ“Å”ana un bez kļūmēm

Problēmas ar augstas slodzes pakalpojumiem rodas gandrÄ«z visās nozarēs, taču finanÅ”u sektoram tās ir kritiskas. X stundā visām kaujas vienÄ«bām jābÅ«t gatavām, un tāpēc bija iepriekÅ” jāzina, kas var notikt, un pat jānosaka diena, kad slodze lēks un kuras sistēmas ar to saskarsies. Neveiksmes ir jārisina un jānovērÅ”, tāpēc nepiecieÅ”amÄ«ba ieviest paredzamo analÄ«tikas sistēmu pat netika apspriesta. Bija nepiecieÅ”ams modernizēt sistēmas, pamatojoties uz monitoringa datiem.

Analīze uz ceļiem

Algu projekts ir viens no jutÄ«gākajiem neveiksmes gadÄ«jumā. Tas ir visprotamākais prognozÄ“Å”anai, tāpēc nolēmām sākt ar to. Augstas savienojamÄ«bas dēļ citām apakÅ”sistēmām, tostarp attālinātajiem banku pakalpojumiem (RBS), var rasties problēmas maksimālās slodzes laikā. Piemēram, klienti, kuri bija sajÅ«smā par SMS par naudas saņemÅ”anu, sāka to aktÄ«vi izmantot. Slodze varētu uzlēkt vairāk nekā par vienu pakāpi. 

Pirmais prognožu modelis tika izveidots manuāli. Mēs ņēmām augÅ”upielādes par pēdējo gadu un aprēķinājām, kurās dienās ir gaidāms maksimālais maksimums: piemēram, 1., 15. un 25., kā arÄ« mēneÅ”a pēdējās dienās. Å is modelis prasÄ«ja ievērojamas darbaspēka izmaksas un nesniedza precÄ«zu prognozi. Tomēr tas atklāja vājās vietas, kur bija nepiecieÅ”ams pievienot aparatÅ«ru, un ļāva optimizēt naudas pārskaitÄ«Å”anas procesu, vienojoties ar enkura klientiem: lai algas neiedotu vienā rāvienā, darÄ«jumi no dažādiem reÄ£ioniem tika sadalÄ«ti laika gaitā. Tagad mēs tos apstrādājam pa daļām, kuras bankas IT infrastruktÅ«ra var ā€œkoŔļātā€ bez kļūmēm.

Saņemot pirmo pozitÄ«vo rezultātu, pārgājām uz prognozÄ“Å”anas automatizāciju, savu kārtu gaidÄ«ja vēl ducis kritisko jomu.

Integrēta pieeja

VTB ir ieviesusi MicroFocus uzraudzÄ«bas sistēmu. No turienes mēs izmantojām datu apkopoÅ”anu prognozÄ“Å”anai, uzglabāŔanas sistēmu un ziņoÅ”anas sistēmu. Faktiski uzraudzÄ«ba jau bija, atlika tikai pievienot metriku, prognožu moduli un izveidot jaunas atskaites. Å o lēmumu atbalsta ārējais darbuzņēmējs Technoserv, tāpēc galvenais darbs pie projekta realizācijas gulēja uz tā speciālistiem, bet modeli uzbÅ«vējām paÅ”i. PrognozÄ“Å”anas sistēma tika izveidota, pamatojoties uz Prophet, atvērtā pirmkoda produktu, ko izstrādājis Facebook. Tas ir viegli lietojams un viegli integrējams ar mÅ«su instalētajiem integrētajiem uzraudzÄ«bas rÄ«kiem un Vertica. Aptuveni runājot, sistēma analizē slodzes grafiku un ekstrapolē to, pamatojoties uz Furjē sērijām. Ir iespējams arÄ« pievienot noteiktus koeficientus pēc dienas, kas ņemti no mÅ«su modeļa. RādÄ«tāji tiek ņemti bez cilvēka iejaukÅ”anās, prognoze tiek automātiski pārrēķināta reizi nedēļā, un adresātiem tiek nosÅ«tÄ«tas jaunas atskaites. 

Å Ä« pieeja identificē galvenos cikliskumus, piemēram, gada, mēneÅ”a, ceturkŔņa un nedēļas. Algu un avansu maksājumi, atvaļinājumu periodi, brÄ«vdienas un izpārdoÅ”anas - tas viss ietekmē zvanu skaitu uz sistēmām. Piemēram, izrādÄ«jās, ka daži cikli pārklājas viens ar otru, un galvenā slodze (75%) sistēmām nāk no Centrālā federālā apgabala. Juridiskas un fiziskas personas uzvedas atŔķirÄ«gi. Ja slodze no ā€œfiziÄ·iemā€ ir samērā vienmērÄ«gi sadalÄ«ta pa nedēļas dienām (tas ir daudz sÄ«ku darÄ«jumu), tad uzņēmumiem 99,9% tiek tērēti darba laikam, un darÄ«jumi var bÅ«t Ä«si vai noformējami vairāku minÅ«tes vai pat stundas.

UzraudzÄ«ba + slodzes pārbaude = prognozÄ“Å”ana un bez kļūmēm

Pamatojoties uz iegÅ«tajiem datiem, tiek noteiktas ilgtermiņa tendences. Jaunā sistēma atklājusi, ka cilvēki masveidā pāriet uz attālinātiem banku pakalpojumiem. To zina visi, taču mēs negaidÄ«jām tādus mērogus un sākumā tam neticējām: zvanu skaits uz banku birojiem sarÅ«k ārkārtÄ«gi strauji, un tieÅ”i tikpat daudz pieaug attālināto darÄ«jumu skaits. AttiecÄ«gi arÄ« slodze uz sistēmām pieaug un turpinās pieaugt. Å obrÄ«d mēs prognozējam slodzi lÄ«dz 2020. gada februārim. Parastās dienas var paredzēt ar kļūdu 3%, bet maksimālās dienas ar kļūdu 10%. Tas ir labs rezultāts.

Slazdiem

Kā parasti, tas nebija bez grÅ«tÄ«bām. Ekstrapolācijas mehānisms, izmantojot Furjē sēriju, slikti Ŕķērso nulli - mēs zinām, ka juridiskās personas nedēļas nogalēs Ä£enerē maz darÄ«jumu, bet prognozÄ“Å”anas modulis rada vērtÄ«bas, kas ir tālu no nulles. Varēja tos labot piespiedu kārtā, bet kruÄ·i nav mÅ«su metode. Turklāt mums bija jāatrisina problēma ar nesāpÄ«gu datu izgÅ«Å”anu no avota sistēmām. Regulārai informācijas apkopoÅ”anai ir nepiecieÅ”ami nopietni skaitļoÅ”anas resursi, tāpēc mēs izveidojām ātru keÅ”atmiņu, izmantojot replikāciju, un saņemam biznesa datus no replikām. Papildu slodzes trÅ«kums galvenajām sistēmām Ŕādos gadÄ«jumos ir bloÄ·Ä“Å”anas prasÄ«ba.

Jauni izaicinājumi

VienkārÅ”ais pÄ«Ä·u prognozÄ“Å”anas uzdevums tika atrisināts: kopÅ” Ŕī gada maija bankā nav bijuÅ”as nekādas ar pārslodzi saistÄ«tas kļūmes, un tajā liela nozÄ«me bija jaunajai prognozÄ“Å”anas sistēmai. Jā, izrādÄ«jās par maz, un tagad banka vēlas saprast, cik bÄ«stamas tai ir virsotnes. Mums ir vajadzÄ«gas prognozes, izmantojot slodzes testÄ“Å”anas metrikas, un aptuveni 30% kritisko sistēmu tas jau darbojas, pārējās tiek iegÅ«tas prognozes. Nākamajā posmā mēs prognozēsim sistēmu noslodzi nevis biznesa darÄ«jumos, bet gan IT infrastruktÅ«ras ziņā, t.i., nokāpsim vienu slāni uz leju. Turklāt mums ir pilnÄ«bā jāautomatizē metrikas vākÅ”ana un prognožu veidoÅ”ana, pamatojoties uz tiem, lai netiktu galā ar lejupielādi. Tajā nav nekā brÄ«niŔķīga ā€” mēs tikai Ŕķērsojam uzraudzÄ«bu un slodzes testÄ“Å”anu saskaņā ar pasaules labāko praksi.

Avots: www.habr.com

Pievieno komentāru