Grafana avatud koodiga onCall intsidentidele reageerimise süsteem

Grafana Labs, mis arendab Grafana andmete visualiseerimise platvormi ja Prometheuse seiresüsteemi, kuulutas välja avatud lähtekoodiga intsidentidele reageerimise süsteemi OnCall, mis on loodud võimaldama meeskondadel koostööd vahejuhtumite lahendamisel ja analüüsimisel. OnCalli pakuti varem patenteeritud tootena ja Grafana ostis selle osana Amixr Inc. omandamisest. eelmisel aastal. Projekti kood on kirjutatud Pythonis ja on avatud AGPLv3 litsentsi all.

Süsteem võimaldab koguda erinevatest seiresüsteemidest teavet kõrvalekallete ja sündmuste kohta ning seejärel andmed automaatselt grupeerida, saata vastutavatele rühmadele teateid ja jälgida probleemi lahendamise olekut. Toetatud on integreerimine seiresüsteemidega Grafana, Prometheus, AlertManager ja Zabbix. Seiresüsteemidest saadavast infost filtreeritakse välja väiksemad ja ebaolulised sündmused, summeeritakse duplikaadid ning kõrvaldatakse probleemid, mida saab lahendada ilma inimese sekkumiseta.

Liigsest infomürast puhastatud olulised sündmused saadetakse teadete saatmise alamsüsteemi, mis tuvastab tuvastatud probleemide kategooriate lahendamise eest vastutavad töötajad ning saadab teated nende töögraafikut ja hõiveastet arvestades (hinnatakse kalendriplaneerija andmeid). Toetatakse intsidentide rotatsiooni erinevate töötajate vahel ning eriti oluliste või lahendamata probleemide eskaleerumist teistele meeskonnaliikmetele või kõrgemal tasemel töötajatele.

Grafana avatud koodiga onCall intsidentidele reageerimise süsteem

Olenevalt intsidendi tõsidusest saab teateid saata telefonikõnede, SMS-ide, e-kirjade, ajakava kalendris sündmuste loomise, Slacki ja Telegrami kiirsõnumite kaudu. Samas saab intsidendi lahendamisega seotud küsimuste arutamiseks Slackis automaatselt luua kanaleid, millega on automaatselt ühendatud nii üksikud töötajad kui terved meeskonnad.

Süsteem pakub paindlikke laiendamis- ja kohandamisvõimalusi (näiteks saate konfigureerida sündmuste rühmitamist ja marsruutimist vastavalt oma eelistustele, määratleda teatiste edastamise reeglid ja kanalid). Väliste süsteemidega integreerimiseks pakutakse API ja Terraformi tuge. Töö juhtimine toimub veebiliidese kaudu.

Grafana avatud koodiga onCall intsidentidele reageerimise süsteem


Allikas: opennet.ru

Lisa kommentaar