Grafana Açık Kodlu OnCall Olay Müdahale Sistemi

Grafana veri görselleştirme platformunu ve Prometheus izleme sistemini geliştiren Grafana Labs, olayları çözmek ve analiz etmek için ekipler arasında iş birliğine olanak sağlamak üzere tasarlanan OnCall olay müdahale sisteminin açık kaynağını duyurdu. OnCall daha önce tescilli bir ürün olarak sağlanıyordu ve Amixr Inc.'in satın alınmasının bir parçası olarak Grafana tarafından satın alındı. geçen sene. Proje kodu Python'da yazılmıştır ve AGPLv3 lisansı altında açıktır.

Sistem, çeşitli izleme sistemlerinden anormallikler ve olaylar hakkında bilgi toplamanıza ve ardından verileri otomatik olarak gruplandırmanıza, sorumlu gruplara bildirim göndermenize ve sorunun çözüm durumunu izlemenize olanak tanır. Grafana, Prometheus, AlertManager ve Zabbix izleme sistemleriyle entegrasyon desteklenmektedir. İzleme sistemlerinden alınan bilgilerden küçük ve önemsiz olaylar filtrelenir, kopyalar toplanır ve insan müdahalesine gerek kalmadan çözülebilecek sorunlar ortadan kaldırılır.

Aşırı bilgi gürültüsünden arındırılmış önemli olaylar, belirlenen sorun kategorilerini çözmekten sorumlu çalışanları belirleyen ve çalışma programlarını ve istihdam derecelerini dikkate alarak bildirimler gönderen bildirim gönderme alt sistemine gönderilir (takvim planlayıcısından gelen veriler değerlendirilir). Olayların farklı çalışanlar arasında rotasyonu ve özellikle önemli veya çözülmemiş sorunların diğer ekip üyelerine veya daha üst düzey çalışanlara iletilmesi desteklenir.

Grafana Açık Kodlu OnCall Olay Müdahale Sistemi

Olayın ciddiyetine bağlı olarak bildirimler telefon görüşmeleri, SMS, e-posta, planlayıcı takviminde etkinlik oluşturma, Slack ve Telegram anlık mesajlaşma programları aracılığıyla gönderilebilir. Aynı zamanda, Slack'te bir olayın çözümüyle ilgili konuları tartışmak için hem bireysel çalışanların hem de tüm ekiplerin otomatik olarak bağlandığı kanallar otomatik olarak oluşturulabiliyor.

Sistem esnek genişletme ve özelleştirme seçenekleri sunar (örneğin, olayların gruplandırılmasını ve yönlendirilmesini tercihlerinize uyacak şekilde yapılandırabilir, bildirim dağıtımı için kurallar ve kanallar tanımlayabilirsiniz). Dış sistemlerle entegrasyon için API ve Terraform desteği sağlanmaktadır. Operasyon bir web arayüzü üzerinden kontrol edilir.

Grafana Açık Kodlu OnCall Olay Müdahale Sistemi


Kaynak: opennet.ru

Yorum ekle