Grafana open source OnCall incidentresponssystem

Grafana Labs, som utvecklar Grafanas datavisualiseringsplattform och övervakningssystemet Prometheus, tillkännagav öppen källkod för OnCall-incidentresponssystemet, utformat för att möjliggöra samarbete mellan team för att lösa och analysera incidenter. OnCall levererades tidigare som en egenutvecklad produkt och förvärvades av Grafana som en del av förvärvet av Amixr Inc. förra året. Projektkoden är skriven i Python och är öppen under AGPLv3-licensen.

Systemet låter dig samla in information om anomalier och händelser från olika övervakningssystem, och sedan automatiskt gruppera data, skicka meddelanden till ansvariga grupper och spåra status för problemlösning. Integration med övervakningssystem Grafana, Prometheus, AlertManager och Zabbix stöds. Från informationen från övervakningssystemen filtreras mindre och obetydliga händelser bort, dubbletter aggregeras och problem som kan lösas utan mänsklig inblandning elimineras.

Betydande händelser som rensas från överflödigt informationsbrus skickas till undersystemet som skickar meddelanden, som identifierar anställda som ansvarar för att lösa de identifierade kategorierna av problem och skickar meddelanden med hänsyn till deras arbetsschema och anställningsgrad (data från kalenderplaneraren bedöms). Rotation av incidenter mellan olika anställda och eskalering av särskilt viktiga eller olösta problem till andra teammedlemmar eller anställda på högre nivåer stöds.

Grafana open source OnCall incidentresponssystem

Beroende på hur allvarlig händelsen är kan aviseringar skickas via telefonsamtal, SMS, e-post, skapande av händelser i schemaläggningskalendern, Slack och Telegrams snabbmeddelanden. Samtidigt kan kanaler automatiskt skapas i Slack för att diskutera frågor relaterade till att lösa en incident, som både enskilda medarbetare och hela team automatiskt kopplas till.

Systemet erbjuder flexibla expansions- och anpassningsalternativ (du kan till exempel konfigurera gruppering och dirigering av händelser för att passa dina preferenser, definiera regler och kanaler för leverans av meddelanden). API- och Terraform-stöd tillhandahålls för integration med externa system. Driften styrs via ett webbgränssnitt.

Grafana open source OnCall incidentresponssystem


Källa: opennet.ru

Lägg en kommentar