Grafana 開放代碼 OnCall 事件響應系統

Grafana數據視覺化平台和Prometheus監控系統的開發人員Grafana Labs宣布開源OnCall事件回應系統,旨在實現團隊之間的協作以解決和分析事件。 OnCall 之前是作為專有產品提供,並作為 Grafana 收購 Amixr Inc. 的一部分而被 Grafana 收購。 去年。 該專案程式碼是用Python編寫的,並在AGPLv3許可證下開放。

該系統可讓您從各種監控系統收集有關異常和事件的信息,然後自動將資料分組,向負責組發送通知並追蹤問題解決的狀態。 支援與監控系統 Grafana、Prometheus、AlertManager 和 Zabbix 整合。 從監控系統收到的訊息中,次要和無關緊要的事件被過濾掉,重複的事件被聚合,無需人工幹預即可解決的問題被消除。

清除過多資訊雜訊的重大事件被發送到通知發送子系統,該子系統識別負責解決已識別問題類別的員工,並考慮到他們的工作時間表和就業程度(評估來自日曆規劃器的資料)來發送通知。 支援在不同員工之間輪流處理事件,並將特別重要或未解決的問題回報給其他團隊成員或更高階層的員工。

Grafana 開放代碼 OnCall 事件響應系統

根據事件的嚴重程度,可以透過電話、簡訊、電子郵件、在排程器行事曆中建立事件、Slack 和 Telegram 即時通訊程式發送通知。 同時,可以在 Slack 中自動建立頻道來討論與解決事件相關的問題,個人員工和整個團隊都會自動連接到該頻道。

該系統提供靈活的擴展和自訂選項(例如,您可以根據自己的喜好配置事件的分組和路由,定義通知傳遞的規則和管道)。 提供 API 和 Terraform 支援以與外部系統整合。 操作透過網路介面進行控制。

Grafana 開放代碼 OnCall 事件響應系統


來源: opennet.ru

添加評論