Σύστημα Ανοιχτού Κώδικα OnCall απόκρισης περιστατικών Grafana

Η Grafana Labs, η οποία αναπτύσσει την πλατφόρμα οπτικοποίησης δεδομένων Grafana και το σύστημα παρακολούθησης Prometheus, ανακοίνωσε τον ανοιχτό κώδικα του συστήματος απόκρισης περιστατικών OnCall, σχεδιασμένο να επιτρέπει τη συνεργασία μεταξύ των ομάδων για την επίλυση και την ανάλυση περιστατικών. Το OnCall παρεχόταν προηγουμένως ως ιδιόκτητο προϊόν και εξαγοράστηκε από τη Grafana ως μέρος της εξαγοράς της Amixr Inc. πέρυσι. Ο κώδικας του έργου είναι γραμμένος σε Python και είναι ανοιχτός με την άδεια AGPLv3.

Το σύστημα σάς επιτρέπει να συλλέγετε πληροφορίες σχετικά με ανωμαλίες και συμβάντα από διάφορα συστήματα παρακολούθησης και, στη συνέχεια, να ομαδοποιείτε αυτόματα τα δεδομένα, να στέλνετε ειδοποιήσεις σε υπεύθυνες ομάδες και να παρακολουθείτε την κατάσταση επίλυσης προβλημάτων. Υποστηρίζεται η ενοποίηση με τα συστήματα παρακολούθησης Grafana, Prometheus, AlertManager και Zabbix. Από τις πληροφορίες που λαμβάνονται από τα συστήματα παρακολούθησης, τα δευτερεύοντα και ασήμαντα συμβάντα φιλτράρονται, τα διπλά συγκεντρώνονται και τα προβλήματα που μπορούν να επιλυθούν χωρίς ανθρώπινη παρέμβαση εξαλείφονται.

Σημαντικά συμβάντα απαλλαγμένα από υπερβολικό θόρυβο πληροφοριών αποστέλλονται στο υποσύστημα αποστολής ειδοποιήσεων, το οποίο προσδιορίζει τους υπαλλήλους που είναι υπεύθυνοι για την επίλυση των προσδιοριζόμενων κατηγοριών προβλημάτων και αποστέλλει ειδοποιήσεις λαμβάνοντας υπόψη το πρόγραμμα εργασίας και τον βαθμό απασχόλησής τους (αξιολογούνται δεδομένα από τον προγραμματιστή ημερολογίου). Υποστηρίζεται η εναλλαγή περιστατικών μεταξύ διαφορετικών εργαζομένων και η κλιμάκωση ιδιαίτερα σημαντικών ή ανεπίλυτων προβλημάτων σε άλλα μέλη της ομάδας ή εργαζόμενους σε υψηλότερα επίπεδα.

Σύστημα Ανοιχτού Κώδικα OnCall απόκρισης περιστατικών Grafana

Ανάλογα με τη σοβαρότητα του συμβάντος, οι ειδοποιήσεις μπορούν να σταλούν μέσω τηλεφωνικών κλήσεων, SMS, email, δημιουργίας συμβάντων στο ημερολόγιο προγραμματιστή, Slack και άμεσων μηνυμάτων Telegram. Ταυτόχρονα, μπορούν να δημιουργηθούν αυτόματα κανάλια στο Slack για συζήτηση ζητημάτων που σχετίζονται με την επίλυση ενός περιστατικού, στο οποίο συνδέονται αυτόματα τόσο μεμονωμένοι υπάλληλοι όσο και ολόκληρες ομάδες.

Το σύστημα παρέχει ευέλικτες επιλογές επέκτασης και προσαρμογής (για παράδειγμα, μπορείτε να διαμορφώσετε την ομαδοποίηση και τη δρομολόγηση συμβάντων σύμφωνα με τις προτιμήσεις σας, να ορίσετε κανόνες και κανάλια για την παράδοση ειδοποιήσεων). Παρέχεται υποστήριξη API και Terraform για ενοποίηση με εξωτερικά συστήματα. Η λειτουργία ελέγχεται μέσω μιας διεπαφής web.

Σύστημα Ανοιχτού Κώδικα OnCall απόκρισης περιστατικών Grafana


Πηγή: opennet.ru

Προσθέστε ένα σχόλιο