Мониторинг + жүктөмдү тестирлөө = болжолдоо жана каталар жок

ВТБ IT бөлүмү бир нече жолу системалардын иштөөсүндөгү өзгөчө кырдаалдар менен күрөшүүгө туура келген, алардагы жүк бир нече эсеге көбөйгөн. Ошондуктан, критикалык системалардагы эң жогорку жүктү болжолдой турган моделди иштеп чыгуу жана сыноо зарылчылыгы бар болчу. Бул үчүн банктын IT адистери мониторинг жүргүзүп, маалыматтарды талдап, болжолдоолорду автоматташтырууну үйрөнүштү. Кайсы инструменттер жүктөмдү болжолдоого жардам берген жана алар ишти оптималдаштырууга жардам бергенби же жокпу, кыскача макалада айтып беребиз.

Мониторинг + жүктөмдү тестирлөө = болжолдоо жана каталар жок

Жогорку жүктөмдүү кызматтар менен байланышкан көйгөйлөр дээрлик бардык тармактарда пайда болот, бирок каржы сектору үчүн алар өтө маанилүү. саат X, бардык согуштук бөлүмдөр даяр болушу керек, ошондуктан, эмне болушу мүмкүн экенин алдын ала билүү керек, ал тургай, жүк секирип жана кайсы системалар ага туш боло турган күндү аныктоо керек болчу. Мүчүлүштүктөр менен күрөшүү жана алдын алуу керек, ошондуктан болжолдуу аналитика системасын ишке ашыруу зарылдыгы талкууланган эмес. Мониторинг маалыматтарынын негизинде системаларды модернизациялоо зарыл болгон.

Сиздин тизеңизде аналитика

Эмгек акы долбоору ишке ашпай калган учурда эң сезимтал долбоорлордун бири. Бул болжолдоо үчүн эң түшүнүктүү, ошондуктан биз андан баштоону чечтик. Жогорку туташуудан улам башка подсистемалар, анын ичинде алыскы банктык кызматтар (RBS) жүктөмдүн эң жогорку чегинде көйгөйлөргө туш болушу мүмкүн. Маселен, акча түшкөндүгү тууралуу SMS-билдирүүлөргө сүйүнгөн кардарлар аны активдүү колдоно башташты. Жүк чоңдуктан ашыкча секирип кетиши мүмкүн. 

Биринчи болжолдоо модели кол менен түзүлгөн. Биз акыркы жылдагы жүктөөлөрдү алып, эң жогорку чокулар кайсы күндөрү күтүлөөрүн эсептеп чыктык: мисалы, 1, 15 жана 25-чи, ошондой эле айдын акыркы күндөрү. Бул модель олуттуу эмгек чыгымдарын талап кылган жана так прогноз берген эмес. Ошого карабастан, ал аппараттык камсыздоону кошуу зарыл болгон тоскоолдуктарды аныктады жана анкердик кардарлар менен макулдашып, акча которуу процессин оптималдаштырууга мүмкүндүк берди: айлык акыларды бир ууртамга бербөө үчүн, ар кайсы региондордон транзакциялар убакыттын өтүшү менен бөлүнгөн. Эми биз аларды банктын IT инфраструктурасы үзгүлтүксүз “чайнаган” бөлүктөргө бөлүп иштетебиз.

Биринчи оң натыйжаны алгандан кийин, биз болжолдоону автоматташтырууга өттүк.

Комплекстүү мамиле

ВТБ MicroFocus компаниясынан мониторинг системасын ишке киргизди. Ал жерден биз болжолдоо үчүн маалыматтарды чогултууну, сактоо тутумун жана отчеттуулук системасын алдык. Чынында, мониторинг буга чейин эле бар болчу, болгону метрикаларды, болжолдоо модулун кошуу жана жаңы отчетторду түзүү гана калды. Бул чечимди тышкы подрядчик Техносерв колдойт, ошондуктан долбоорду ишке ашыруу боюнча негизги жумуш анын адистерине жүктөлгөн, бирок моделди өзүбүз курганбыз. Божомолдоо системасы Facebook тарабынан иштелип чыккан ачык булактуу продукт Пайгамбардын негизинде жасалган. Аны колдонуу оңой жана биздин орнотулган интегралдык мониторинг куралдарыбыз жана Vertica менен оңой интеграцияланат. Болжол менен айтканда, система жүк графигин талдап, Фурье сериясынын негизинде аны экстраполяциялайт. Ошондой эле биздин моделден алынган кээ бир коэффициенттерди күн боюнча кошууга болот. Метрикалар адамдын кийлигишүүсүз алынат, болжолдоо жумасына бир жолу автоматтык түрдө кайра эсептелип, алуучуларга жаңы отчеттор жөнөтүлөт. 

Бул ыкма негизги циклдикти аныктайт, мисалы, жылдык, айлык, кварталдык жана жумалык. Эмгек акыларды жана аванстарды төлөө, каникул мезгили, майрамдар жана сатуулар - мунун баары системаларга чалуулардын санына таасирин тийгизет. Мисалы, кээ бир циклдер бири-бирин кайталайт жана системаларга негизги жүк (75%) Борбордук федералдык округдан келет. Юридикалык жана жеке жактар ​​ар кандай жүрүм-туруму. Эгерде "физиктердин" жүктөмү жуманын күндөрүнө салыштырмалуу бирдей бөлүштүрүлсө (бул майда транзакциялар көп), анда компаниялар үчүн 99,9% жумуш убактысына жумшалат, ал эми транзакциялар кыска болушу мүмкүн же бир нече убакыт ичинде иштетилиши мүмкүн. мүнөт же саат.

Мониторинг + жүктөмдү тестирлөө = болжолдоо жана каталар жок

Алынган маалыматтардын негизинде узак мөөнөттүү тенденциялар аныкталат. Жаңы система эл массалык түрдө алыскы банктык тейлөөгө өтүп жатканын ачыктады. Муну баары билет, бирок биз мындай масштабды күткөн эмеспиз жана адегенде ага ишенген эмеспиз: банк кеңселерине чалуулардын саны өтө тездик менен кыскарууда, ал эми алыскы транзакциялардын саны так ушундай эле суммага өсүп жатат. Демек, системаларга жүк да өсүп жатат жана мындан ары да өсө берет. Биз азыр жүктү 2020-жылдын февралына чейин болжолдоп жатабыз. Кадимки күндөрдү 3% ката менен, ал эми эң жогорку күндөрдү 10% ката менен алдын ала айтууга болот. Бул жакшы натыйжа.

тузактар

Адаттагыдай эле бул кыйынчылыксыз болгон жок. Фурье сериясын колдонгон экстраполяция механизми нөлдү жакшы кесип өтпөйт - биз билебиз, юридикалык жактар ​​дем алыш күндөрү бир нече транзакцияларды түзүшөт, бирок болжолдоо модулу нөлдөн алыс баалуулуктарды чыгарат. Аларды мажбурлап оңдоого болот эле, бирок балдак биздин ыкма эмес. Мындан тышкары, биз булак системаларынан маалыматтарды оорутпай алуу маселесин чечишибиз керек болчу. Маалыматты үзгүлтүксүз чогултуу олуттуу эсептөө ресурстарын талап кылат, ошондуктан биз репликацияны колдонуу менен тез кэштерди түздүк жана репликалардан бизнес маалыматтарды алабыз. Мындай учурларда мастер-системаларга кошумча жүктүн жоктугу бөгөт коюу талабы болуп саналат.

Жаңы чакырыктар

Чокуларды болжолдоонун түз милдети чечилди: үстүбүздөгү жылдын май айынан бери банкта ашыкча жүктөм менен байланышкан мүчүлүштүктөр болгон жок, мында болжолдоонун жаңы системасы маанилүү роль ойноду. Ооба, бул жетишсиз болуп чыкты, эми банк ал үчүн чокулардын канчалык кооптуу экенин түшүнгүсү келет. Бизге жүктөмдү тестирлөөнүн метрикасын колдонуу менен болжолдоо керек, ал эми критикалык системалардын болжол менен 30% үчүн бул иштеп жатат, калгандары болжолдоолорду алуу процессинде. Кийинки этапта биз системалардын жүгүн бизнес транзакцияларында эмес, IT инфраструктурасы жагынан алдын ала айтабыз, б.а. биз бир катмарга түшөбүз. Мындан тышкары, жүктөөлөр менен алек болбош үчүн, метрикаларды чогултууну жана алардын негизинде болжолдорду курууну толук автоматташтыруу керек. Мында эч кандай кооз нерсе жок - биз жөн гана дүйнөлүк мыкты тажрыйбага ылайык мониторинг жана жүктөө тестирлөөдөн өтүп жатабыз.

Source: www.habr.com

Комментарий кошуу