Grafana Open-Code OnCall Incident Response System

Grafana Labs, dy't it Grafana-datafisualisaasjeplatfoarm en it Prometheus-monitorsysteem ûntwikkelet, kundige de iepen boarne fan it OnCall-ynsidint-antwurdsysteem oan, ûntworpen om gearwurking tusken teams mooglik te meitsjen om ynsidinten op te lossen en te analysearjen. OnCall waard earder levere as in proprietêr produkt en waard oankocht troch Grafana as ûnderdiel fan har oankeap fan Amixr Inc. ôfrûne jier. De projektkoade is skreaun yn Python en is iepen ûnder de AGPLv3-lisinsje.

It systeem lit jo ynformaasje sammelje oer anomalies en eveneminten fan ferskate tafersjochsystemen, en dan automatysk de gegevens groepearje, notifikaasjes stjoere nei ferantwurdlike groepen en de status fan probleemoplossing folgje. Yntegraasje mei tafersjochsystemen Grafana, Prometheus, AlertManager en Zabbix wurdt stipe. Fan 'e ynformaasje ûntfongen fan tafersjochsystemen wurde lytse en ûnbelangrike eveneminten filtere, duplikaten wurde aggregearre en problemen dy't kinne wurde oplost sûnder minsklike yntervinsje wurde elimineare.

Wichtige eveneminten dy't wiske binne fan oerstallige ynformaasjelûd wurde stjoerd nei it notifikaasjeferstjoerende subsysteem, dat meiwurkers identifisearret ferantwurdlik foar it oplossen fan 'e identifisearre kategoryen fan problemen en ferstjoert notifikaasjes mei rekkening mei har wurkskema en mjitte fan wurkgelegenheid (gegevens fan 'e kalinderplanner wurde beoardiele). Rotaasje fan ynsidinten tusken ferskate meiwurkers en eskalaasje fan benammen wichtige of net oploste problemen nei oare teamleden of meiwurkers op hegere nivo's wurdt stipe.

Grafana Open-Code OnCall Incident Response System

Ofhinklik fan 'e earnst fan it ynsidint kinne notifikaasjes stjoerd wurde fia tillefoantsjes, SMS, e-post, it meitsjen fan eveneminten yn' e plannerkalinder, Slack en Telegram instant messengers. Tagelyk kinne kanalen automatysk wurde makke yn Slack om problemen te besprekken yn ferbân mei it oplossen fan in ynsidint, wêrmei sawol yndividuele meiwurkers as heule teams automatysk ferbûn binne.

It systeem biedt fleksibele útwreidings- en oanpassingsopsjes (jo kinne bygelyks de groepearring en routing fan eveneminten ynstelle om te passen by jo foarkar, regels en kanalen definiearje foar levering fan notifikaasjes). API- en Terraform-stipe wurde levere foar yntegraasje mei eksterne systemen. Operaasje wurdt regele fia in web ynterface.

Grafana Open-Code OnCall Incident Response System


Boarne: opennet.ru

Add a comment