Sistem de răspuns la incidente cu cod deschis Grafana OnCall

Grafana Labs, care dezvoltă platforma de vizualizare a datelor Grafana și sistemul de monitorizare Prometheus, a anunțat sursa deschisă a sistemului de răspuns la incident OnCall, conceput pentru a permite colaborarea între echipe pentru a rezolva și analiza incidentele. OnCall a fost furnizat anterior ca produs proprietar și a fost achiziționat de Grafana ca parte a achiziției Amixr Inc. anul trecut. Codul proiectului este scris în Python și este deschis sub licența AGPLv3.

Sistemul vă permite să colectați informații despre anomalii și evenimente din diverse sisteme de monitorizare, apoi să grupați automat datele, să trimiteți notificări către grupurile responsabile și să urmăriți starea rezolvării problemei. Integrarea cu sistemele de monitorizare Grafana, Prometheus, AlertManager și Zabbix este acceptată. Din informațiile primite de la sistemele de monitorizare, evenimentele minore și nesemnificative sunt filtrate, duplicatele sunt agregate și problemele care pot fi rezolvate fără intervenția umană.

Evenimentele semnificative curățate de excesul de zgomot informațional sunt transmise subsistemului de transmitere a notificărilor, care identifică angajații responsabili cu rezolvarea categoriilor de probleme identificate și trimite notificări ținând cont de programul lor de lucru și gradul de angajare (se evaluează datele din planificatorul calendaristic). Este susținută rotația incidentelor între diferiți angajați și escaladarea unor probleme deosebit de importante sau nerezolvate către alți membri ai echipei sau angajați de la niveluri superioare.

Sistem de răspuns la incidente cu cod deschis Grafana OnCall

În funcție de gravitatea incidentului, notificările pot fi trimise prin apeluri telefonice, SMS, e-mail, crearea de evenimente în calendarul de planificare, mesagerie instant Slack și Telegram. În același timp, canalele pot fi create automat în Slack pentru a discuta probleme legate de rezolvarea unui incident, la care sunt conectați automat atât angajații individuali, cât și echipele întregi.

Sistemul oferă opțiuni flexibile de extindere și personalizare (de exemplu, puteți configura gruparea și rutarea evenimentelor în funcție de preferințele dvs., puteți defini reguli și canale pentru livrarea notificărilor). Suportul API și Terraform este furnizat pentru integrarea cu sisteme externe. Funcționarea este controlată printr-o interfață web.

Sistem de răspuns la incidente cu cod deschis Grafana OnCall


Sursa: opennet.ru

Adauga un comentariu