Sistema de resposta a incidentes de código aberto Grafana OnCall

Grafana Labs, que desenvolve a plataforma de visualización de datos Grafana e o sistema de monitorización Prometheus, anunciou o código fonte aberto para o sistema de resposta a incidentes OnCall, deseñado para garantir que os equipos traballen xuntos para eliminar e analizar incidentes. OnCall foi enviado anteriormente como un produto propietario e foi adquirido por Grafana a través da súa adquisición de Amixr Inc. o ano pasado. O código do proxecto está escrito en Python e está aberto baixo a licenza AGPLv3.

O sistema permítelle recoller información sobre anomalías e eventos de varios sistemas de vixilancia e, a continuación, agrupar automaticamente os datos, enviar notificacións aos grupos responsables e rastrexar o estado da resolución do problema. Admítese a integración cos sistemas de vixilancia Grafana, Prometheus, AlertManager e Zabbix. Os eventos menores e insignificantes fíltranse da información recibida dos sistemas de monitorización, agréganse duplicados e exclúense os problemas que se poidan resolver sen intervención humana.

Os eventos significativos eliminados do ruído de información innecesario envíanse ao subsistema de envío de notificacións, que identifica aos empregados responsables de resolver as categorías de problemas identificadas e envía notificacións tendo en conta o seu horario laboral e o seu grao de emprego (avalíase os datos do planificador). Admítese a rotación da vinculación de incidencias entre diferentes empregados e a escalada de problemas especialmente importantes ou sen resolver a outros membros do equipo ou empregados de niveis superiores.

Sistema de resposta a incidentes de código aberto Grafana OnCall

Dependendo da gravidade do incidente, pódense enviar notificacións a través de chamadas telefónicas, SMS, correo electrónico, creando eventos no calendario do planificador, mensaxeiros de Slack e Telegram. Ao mesmo tempo, Slack pode crear automaticamente canles para discutir cuestións relacionadas coa resolución dun incidente, ás que se conectan automaticamente tanto os empregados individuais como os equipos completos.

O sistema ofrece opcións flexibles de expansión e personalización (por exemplo, pode personalizar a agrupación e o enrutamento de eventos para adaptarse ás súas preferencias, definir regras e canles para enviar notificacións). Para a integración con sistemas externos, ofrécese unha API e soporte para Terraform. A xestión do traballo realízase a través da interface web.

Sistema de resposta a incidentes de código aberto Grafana OnCall


Fonte: opennet.ru

Engadir un comentario