Grafana Open-Code OnCall Incident Response System

Grafana Labs, der udvikler Grafana-datavisualiseringsplatformen og Prometheus-overvågningssystemet, annoncerede den åbne kildekode til OnCall-hændelsesresponssystemet, designet til at sikre, at teams arbejder sammen om at eliminere og analysere hændelser. OnCall blev tidligere sendt som et proprietært produkt og blev opkøbt af Grafana gennem overtagelsen af ​​Amixr Inc. sidste år. Projektkoden er skrevet i Python og er åben under AGPLv3-licensen.

Systemet giver dig mulighed for at indsamle oplysninger om uregelmæssigheder og hændelser fra forskellige overvågningssystemer og derefter automatisk gruppere dataene, sende meddelelser til ansvarlige grupper og spore status for problemløsning. Integration med Grafana, Prometheus, AlertManager og Zabbix overvågningssystemer er understøttet. Mindre og ubetydelige hændelser filtreres fra informationen modtaget fra overvågningssystemer, dubletter aggregeres og problemer, der kan løses uden menneskelig indgriben, udelukkes.

Væsentlige hændelser, der er ryddet for unødvendig informationsstøj, sendes til undersystemet, der sender besked, som identificerer medarbejdere, der er ansvarlige for at løse de identificerede kategorier af problemer, og sender meddelelser under hensyntagen til deres arbejdsplan og beskæftigelsesgrad (dataene fra planlæggeren evalueres). Rotationen af ​​bindingen af ​​hændelser mellem forskellige medarbejdere og eskalering af særligt vigtige eller uløste problemer til andre teammedlemmer eller medarbejdere på højere niveauer understøttes.

Grafana Open-Code OnCall Incident Response System

Afhængigt af sværhedsgraden af ​​hændelsen, kan notifikationer sendes via telefonopkald, SMS, e-mail, oprettelse af begivenheder i planlægningskalenderen, Slack og Telegram messengers. Samtidig kan Slack automatisk oprette kanaler til at diskutere problemstillinger i forbindelse med løsning af en hændelse, som både individuelle medarbejdere og hele teams automatisk kobles til.

Systemet giver fleksible udvidelses- og tilpasningsmuligheder (du kan f.eks. tilpasse grupperingen og routingen af ​​begivenheder, så de passer til dine præferencer, definere regler og kanaler til levering af notifikationer). Til integration med eksterne systemer leveres en API og Terraform support. Arbejdsledelse udføres via web-grænsefladen.

Grafana Open-Code OnCall Incident Response System


Kilde: opennet.ru

Tilføj en kommentar