نظام Grafana Open-Code OnCall للاستجابة للحوادث

أعلنت Grafana Labs ، التي تطور منصة تصور البيانات Grafana ونظام مراقبة Prometheus ، عن رمز مفتوح المصدر لنظام الاستجابة للحوادث OnCall ، المصمم لضمان عمل الفرق معًا للقضاء على الحوادث وتحليلها. تم شحن OnCall سابقًا كمنتج مملوك واستحوذت عليه شركة Grafana من خلال استحواذها على Amixr Inc. العام الماضي. تمت كتابة كود المشروع بلغة Python وهو مفتوح بموجب ترخيص AGPLv3.

يسمح لك النظام بجمع معلومات حول الحالات الشاذة والأحداث من أنظمة المراقبة المختلفة ، ثم تجميع البيانات تلقائيًا وإرسال الإشعارات إلى المجموعات المسؤولة وتتبع حالة حل المشكلة. يتم دعم التكامل مع أنظمة المراقبة Grafana و Prometheus و AlertManager و Zabbix. يتم تصفية الأحداث الصغيرة وغير المهمة من المعلومات الواردة من أنظمة المراقبة ، ويتم تجميع التكرارات واستبعاد المشكلات التي يمكن حلها دون تدخل بشري.

يتم إرسال الأحداث المهمة التي تم مسحها من ضوضاء المعلومات غير الضرورية إلى النظام الفرعي لإرسال الإشعارات ، والذي يحدد الموظفين المسؤولين عن حل فئات المشكلات المحددة ويرسل الإشعارات مع مراعاة جدول عملهم ودرجة التوظيف (يتم تقييم البيانات من المجدول). يتم دعم تناوب ربط الحوادث بين مختلف الموظفين وتصعيد المشكلات ذات الأهمية الخاصة أو التي لم يتم حلها لأعضاء الفريق الآخرين أو الموظفين من المستويات الأعلى.

نظام Grafana Open-Code OnCall للاستجابة للحوادث

اعتمادًا على خطورة الحادث ، يمكن إرسال الإشعارات عبر المكالمات الهاتفية والرسائل القصيرة والبريد الإلكتروني وإنشاء أحداث في تقويم الجدولة ومراسلي Slack و Telegram. في الوقت نفسه ، يمكن لـ Slack إنشاء قنوات تلقائيًا لمناقشة القضايا المتعلقة بحل حادث ، والتي يرتبط بها كل من الموظفين الفرديين والفرق بأكملها تلقائيًا.

يوفر النظام خيارات توسعة وتخصيص مرنة (على سبيل المثال ، يمكنك تخصيص تجميع الأحداث وتوجيهها لتناسب تفضيلاتك ، وتحديد القواعد والقنوات لتقديم الإشعارات). للتكامل مع الأنظمة الخارجية ، يتم توفير دعم API و Terraform. تتم إدارة العمل من خلال واجهة الويب.

نظام Grafana Open-Code OnCall للاستجابة للحوادث


المصدر: opennet.ru

إضافة تعليق