Grafana Open-Code OnCall Incident Response System

Grafana Labs, koja razvija Grafana platformu za vizualizaciju podataka i sistem za praćenje Prometheus, najavila je otvoreni izvor OnCall sistema za odgovor na incidente, dizajniran da omogući saradnju među timovima za rješavanje i analizu incidenata. OnCall je ranije bio dostupan kao vlasnički proizvod i kupila ga je Grafana kao dio akvizicije Amixr Inc. prošle godine. Kod projekta je napisan u Python-u i otvoren je pod AGPLv3 licencom.

Sistem vam omogućava da prikupljate informacije o anomalijama i događajima iz različitih sistema za praćenje, a zatim automatski grupišete podatke, šaljete obavještenja odgovornim grupama i pratite status rješavanja problema. Podržana je integracija sa monitoring sistemima Grafana, Prometheus, AlertManager i Zabbix. Iz informacija dobijenih od sistema za praćenje, manji i beznačajni događaji se filtriraju, duplikati se agregiraju i eliminišu problemi koji se mogu riješiti bez ljudske intervencije.

Značajni događaji očišćeni od viška informacija šalju se u podsistem za slanje obaveštenja, koji identifikuje zaposlene odgovorne za rešavanje identifikovanih kategorija problema i šalje obaveštenja uzimajući u obzir njihov raspored rada i stepen zaposlenosti (procenjuju se podaci iz kalendarskog planera). Podržava se rotacija incidenata između različitih zaposlenika i eskalacija posebno važnih ili neriješenih problema na druge članove tima ili zaposlenike na višim nivoima.

Grafana Open-Code OnCall Incident Response System

Ovisno o ozbiljnosti incidenta, obavještenja se mogu slati putem telefonskih poziva, SMS-a, e-pošte, kreiranja događaja u kalendaru planera, Slack i Telegram instant messengera. Istovremeno, u Slacku se mogu automatski kreirati kanali za diskusiju o pitanjima vezanim za rješavanje incidenta, na koji su automatski povezani i pojedinačni zaposlenici i cijeli timovi.

Sistem pruža fleksibilne opcije proširenja i prilagođavanja (na primjer, možete konfigurirati grupisanje i usmjeravanje događaja prema vašim željama, definirati pravila i kanale za isporuku obavijesti). API i Terraform podrška su obezbeđeni za integraciju sa eksternim sistemima. Rad se kontroliše preko web interfejsa.

Grafana Open-Code OnCall Incident Response System


izvor: opennet.ru

Dodajte komentar