Grafana open source OnCall sustav odgovora na incidente

Grafana Labs, koja razvija platformu za vizualizaciju podataka Grafana i nadzorni sustav Prometheus, najavila je otvoreni izvor sustava za odgovor na incidente OnCall, dizajniranog da omogući suradnju između timova za rješavanje i analizu incidenata. OnCall je prije bio dostupan kao vlasnički proizvod, a kupila ga je Grafana u sklopu akvizicije tvrtke Amixr Inc. prošle godine. Projektni kod je napisan u Pythonu i otvoren je pod licencom AGPLv3.

Sustav omogućuje prikupljanje informacija o anomalijama i događajima iz različitih nadzornih sustava, zatim automatsko grupiranje podataka, slanje obavijesti odgovornim skupinama i praćenje statusa rješavanja problema. Podržana je integracija sa sustavima za nadzor Grafana, Prometheus, AlertManager i Zabbix. Iz informacija dobivenih iz sustava nadzora filtriraju se manji i beznačajni događaji, agregiraju se duplikati i eliminiraju problemi koji se mogu riješiti bez ljudske intervencije.

Značajni događaji očišćeni od viška informacijskog šuma šalju se u podsustav za slanje obavijesti, koji identificira djelatnike odgovorne za rješavanje identificiranih kategorija problema i šalje obavijesti uzimajući u obzir njihov radni raspored i stupanj zaposlenosti (procjenjuju se podaci iz kalendarskog planera). Podržava se rotacija incidenata između različitih zaposlenika i eskalacija posebno važnih ili neriješenih problema drugim članovima tima ili zaposlenicima na višim razinama.

Grafana open source OnCall sustav odgovora na incidente

Ovisno o ozbiljnosti incidenta, obavijesti se mogu slati telefonskim pozivima, SMS-om, e-poštom, kreiranjem događaja u kalendaru raspoređivača, Slack i Telegram instant messengerima. Istodobno, u Slacku se mogu automatski kreirati kanali za raspravu o problemima vezanim uz rješavanje incidenta, na koje se automatski povezuju i pojedinačni zaposlenici i cijeli timovi.

Sustav nudi fleksibilne mogućnosti proširenja i prilagodbe (na primjer, možete konfigurirati grupiranje i usmjeravanje događaja prema svojim željama, definirati pravila i kanale za isporuku obavijesti). Za integraciju s vanjskim sustavima osigurana je podrška za API i Terraform. Radom se upravlja putem web sučelja.

Grafana open source OnCall sustav odgovora na incidente


Izvor: opennet.ru

Dodajte komentar