Grafana Open-Code OnCall Incident Response System

Grafana Labs, kiu disvolvas la Grafana-datumbildigadplatformon kaj la Prometheus-monitorsistemon, anoncis la malferman fonton de la OnCall-okazaĵrespondsistemo, dizajnita por ebligi kunlaboron inter teamoj por solvi kaj analizi okazaĵojn. OnCall antaŭe estis disponigita kiel proprieta produkto kaj estis akirita fare de Grafana kiel parto de ĝia akiro de Amixr Inc. pasintjare. La projektkodo estas skribita en Python kaj estas malfermita sub la permesilo AGPLv3.

La sistemo permesas vin kolekti informojn pri anomalioj kaj eventoj de diversaj monitoraj sistemoj, kaj poste aŭtomate grupigi la datumojn, sendi sciigojn al respondecaj grupoj kaj spuri la staton de problemo solvado. Integriĝo kun monitoraj sistemoj Grafana, Prometheus, AlertManager kaj Zabbix estas subtenata. El la informoj ricevitaj de monitoraj sistemoj, malgravaj kaj sensignifaj eventoj estas filtritaj, duplikatoj estas kunigitaj kaj problemoj, kiuj povas esti solvitaj sen homa interveno, estas eliminitaj.

Signifaj eventoj purigitaj de troa informo-bruo estas senditaj al la sciiga senda subsistemo, kiu identigas dungitojn respondecajn por solvi la identigitajn kategoriojn de problemoj kaj sendas sciigojn konsiderante ilian laborhoraron kaj gradon de dungado (datenoj de la kalendara planisto estas taksitaj). Rotacio de okazaĵoj inter malsamaj dungitoj kaj eskalado de precipe gravaj aŭ nesolvitaj problemoj al aliaj teamanoj aŭ dungitoj sur pli altaj niveloj estas subtenataj.

Grafana Open-Code OnCall Incident Response System

Depende de la severeco de la okazaĵo, sciigoj povas esti senditaj per telefonvokoj, SMS, retpoŝto, kreante eventojn en la horarkalendaro, tujmesaĝiloj de Slack kaj Telegram. Samtempe, kanaloj povas esti aŭtomate kreitaj en Slack por diskuti problemojn ligitajn al solvado de okazaĵo, al kiu kaj individuaj dungitoj kaj tutaj teamoj estas aŭtomate konektitaj.

La sistemo provizas flekseblajn eblojn pri ekspansio kaj personigo (ekzemple, vi povas agordi la grupigon kaj vojigon de eventoj laŭ viaj preferoj, difini regulojn kaj kanalojn por sciiga livero). API kaj Terraform-subteno estas disponigita por integriĝo kun eksteraj sistemoj. Funkciado estas kontrolita per interreta interfaco.

Grafana Open-Code OnCall Incident Response System


fonto: opennet.ru

Aldoni komenton