Grafana Open-Code OnCall Incident Response System

Grafana маалыматтарды визуализациялоо платформасын жана Prometheus мониторинг системасын иштеп чыгуучу Grafana Labs инциденттерди чечүү жана талдоо үчүн командалардын кызматташуусун камсыз кылуу үчүн иштелип чыккан OnCall инциденттерге жооп берүү тутумунун ачык булагын жарыялады. OnCall мурда менчик продукт катары берилген жана Grafana тарабынан Amixr Incти сатып алуунун бир бөлүгү катары алынган. былтыр. Долбоордун коду Python тилинде жазылган жана AGPLv3 лицензиясы астында ачык.

Система ар кандай мониторинг системаларынан аномалиялар жана окуялар жөнүндө маалыматты чогултууга, андан кийин автоматтык түрдө маалыматтарды топтоштурууга, жооптуу топторго эскертмелерди жөнөтүүгө жана көйгөйдү чечүүнүн абалын көзөмөлдөөгө мүмкүндүк берет. Grafana, Prometheus, AlertManager жана Zabbix мониторинг системалары менен интеграция колдоого алынат. Мониторинг тутумдарынан алынган маалыматтардан майда жана анча маанилүү эмес окуялар чыпкаланып, кайталанган окуялар топтолуп, адамдын кийлигишүүсүз чечиле турган көйгөйлөр жок кылынат.

Ашыкча маалымат ызы-чуусунан тазаланган олуттуу окуялар билдирүү жөнөтүүчү чакан системага жөнөтүлөт, ал көйгөйлөрдүн аныкталган категорияларын чечүүгө жооптуу кызматкерлерди аныктайт жана алардын иш графигин жана иш даражасын эске алуу менен билдирүүлөрдү жөнөтөт (календардык пландоочунун маалыматтары бааланат). Ар кандай кызматкерлердин ортосундагы инциденттерди ротациялоо жана өзгөчө маанилүү же чечилбеген көйгөйлөрдү команданын башка мүчөлөрүнө же жогорку деңгээлдеги кызматкерлерге жеткирүү колдоого алынат.

Grafana Open-Code OnCall Incident Response System

Окуянын оордугуна жараша, эскертмелер телефон чалуулар, SMS, электрондук почта, пландаштыруучу календарда окуяларды түзүү, Slack жана Telegram мессенджерлери аркылуу жөнөтүлүшү мүмкүн. Ошол эле учурда инцидентти чечүү менен байланышкан маселелерди талкуулоо үчүн Slack'те каналдар автоматтык түрдө түзүлүшү мүмкүн, ага айрым кызматкерлер да, бүт командалар да автоматтык түрдө кошулат.

Система ийкемдүү кеңейтүү жана ыңгайлаштыруу варианттарын камсыздайт (мисалы, сиз өз каалооңузга ылайык окуяларды топтоону жана багыттоосун конфигурациялай аласыз, эрежелерди жана эскертмелерди жеткирүү каналдарын аныктай аласыз). API жана Terraform колдоосу тышкы системалар менен интеграциялоо үчүн берилет. Иштөө веб-интерфейс аркылуу көзөмөлдөнөт.

Grafana Open-Code OnCall Incident Response System


Source: opennet.ru

Комментарий кошуу