Grafana Open-Code OnCall Incident Response System

Ang Grafana Labs, na bumuo ng Grafana data visualization platform at ang Prometheus monitoring system, ay nag-anunsyo ng open source code para sa OnCall incident response system, na idinisenyo upang matiyak na ang mga team ay magtutulungan upang alisin at suriin ang mga insidente. Ang OnCall ay dating ipinadala bilang isang pagmamay-ari na produkto at nakuha ng Grafana sa pamamagitan ng pagkuha nito sa Amixr Inc. noong nakaraang taon. Ang code ng proyekto ay nakasulat sa Python at bukas sa ilalim ng lisensya ng AGPLv3.

Pinapayagan ka ng system na mangolekta ng impormasyon tungkol sa mga anomalya at kaganapan mula sa iba't ibang mga sistema ng pagsubaybay, at pagkatapos ay awtomatikong igrupo ang data, magpadala ng mga abiso sa mga responsableng grupo at subaybayan ang katayuan ng paglutas ng problema. Ang pagsasama sa mga sistema ng pagsubaybay sa Grafana, Prometheus, AlertManager at Zabbix ay suportado. Ang mga menor de edad at hindi gaanong mahahalagang kaganapan ay sinasala mula sa impormasyong natanggap mula sa mga sistema ng pagsubaybay, ang mga duplicate ay pinagsama-sama at ang mga problema na maaaring malutas nang walang interbensyon ng tao ay hindi kasama.

Ang mga makabuluhang kaganapan na naalis sa hindi kinakailangang ingay ng impormasyon ay ipinadala sa subsystem ng pagpapadala ng abiso, na kinikilala ang mga empleyado na responsable para sa paglutas ng mga natukoy na kategorya ng mga problema at nagpapadala ng mga abiso na isinasaalang-alang ang kanilang iskedyul ng trabaho at antas ng trabaho (ang data mula sa scheduler ay sinusuri). Sinusuportahan ang pag-ikot ng pagsasali ng mga insidente sa pagitan ng iba't ibang empleyado at ang pagdami ng partikular na mahalaga o hindi nalutas na mga problema sa ibang miyembro ng team o empleyado ng mas mataas na antas.

Grafana Open-Code OnCall Incident Response System

Depende sa kalubhaan ng insidente, ang mga abiso ay maaaring ipadala sa pamamagitan ng mga tawag sa telepono, SMS, email, paglikha ng mga kaganapan sa kalendaryo ng scheduler, Slack at Telegram messenger. Kasabay nito, ang Slack ay maaaring awtomatikong lumikha ng mga channel para sa pagtalakay sa mga isyu na nauugnay sa paglutas ng isang insidente, kung saan ang parehong mga indibidwal na empleyado at buong koponan ay awtomatikong konektado.

Ang system ay nagbibigay ng nababaluktot na pagpapalawak at mga pagpipilian sa pagpapasadya (halimbawa, maaari mong i-customize ang pagpapangkat at pagruruta ng mga kaganapan upang umangkop sa iyong mga kagustuhan, tukuyin ang mga panuntunan at mga channel para sa paghahatid ng mga abiso). Para sa pagsasama sa mga panlabas na system, isang API at suporta sa Terraform ay ibinigay. Ang pamamahala sa trabaho ay isinasagawa sa pamamagitan ng web-interface.

Grafana Open-Code OnCall Incident Response System


Pinagmulan: opennet.ru

Magdagdag ng komento