Кампанія Grafana адкрыла код сістэмы рэагавання на інцыдэнты OnCall

Кампанія Grafana Labs, якая развівае платформу візуалізацыі дадзеных Grafana і сістэму маніторынгу Prometheus, абвясціла аб адкрыцці зыходных тэкстаў сістэмы рэагавання на інцыдэнты OnCall, прызначанай для забеспячэння сумеснай працы каманд па ўхіленні і разбору інцыдэнтаў. OnCall раней пастаўляўся ў форме прапрыетарнага прадукта і быў набыты Grafana падчас паглынання кампаніі Amixr Inc. у мінулым годзе. Код праекту напісаны на мове Python і адчынены пад ліцэнзіяй AGPLv3.

Сістэма дазваляе збіраць інфармацыю пра анамаліі і падзеі з розных сістэм маніторынгу, пасля чаго аўтаматычна групаваць дадзеныя, накіроўваць апавяшчэнні адказным групам і адсочваць стан рашэння праблем. Падтрымліваецца інтэграцыя з сістэмамі маніторынгу Grafana, Prometheus, AlertManager і Zabbix. З атрыманай ад сістэм маніторынгу інфармацыя адфільтроўваюцца другарадныя і малазначныя падзеі, агрэгуюцца дублікаты і выключаюцца праблемы, якія могуць быць вырашаны без удзелу чалавека.

Вычышчаныя ад лішняга інфармацыйнага шуму значныя падзеі паступаюць у падсістэму адпраўкі абвестак, якая вылучае супрацоўнікаў, адказных за рашэнні выяўленых катэгорый праблем, і адпраўляе апавяшчэнні з улікам графіка іх працы і ступені занятасці (ацэньваюцца дадзеныя з календара-планавальніка). Падтрымліваецца ратацыя прывязкі інцыдэнтаў паміж рознымі супрацоўнікамі і эскалацыя асабліва важных або астатніх без вырашэння праблем іншым удзельнікам каманды або работнікам больш высокіх ступеняў.

Кампанія Grafana адкрыла код сістэмы рэагавання на інцыдэнты OnCall

У залежнасці ад ступені важнасці інцыдэнту апавяшчэння могуць адпраўляцца праз тэлефонныя званкі, SMS, электронную пошту, стварэнне падзей у календары-планавальніку, месэнджары Slack і Telegram. Пры гэтым у Slack могуць аўтаматычна стварацца каналы для абмеркавання пытанняў, злучаных з рашэннем інцыдэнту, да якіх аўтаматычна падлучаюцца як асобныя супрацоўнікі, так і цэлыя каманды.

Сістэма дае гнуткія магчымасці пашырэння і налады (напрыклад, пад свае перавагі можна наладзіць групоўку і маршрутызацыю падзей, вызначыць правілы і каналы дастаўкі апавяшчэнняў). Для інтэграцыі з вонкавымі сістэмамі падаецца API і падтрымка Terraform. Упраўленне працай ажыццяўляецца праз web-інтэрфейс.

Кампанія Grafana адкрыла код сістэмы рэагавання на інцыдэнты OnCall


Крыніца: opennet.ru

Дадаць каментар