Παρακολούθηση Sportmaster - πώς και με τι

Σκεφτήκαμε να δημιουργήσουμε ένα σύστημα παρακολούθησης στο στάδιο της δημιουργίας ομάδων προϊόντων. Έγινε σαφές ότι η επιχείρησή μας - η εκμετάλλευση - δεν εμπίπτει σε αυτές τις ομάδες. Γιατί αυτό?

Το γεγονός είναι ότι όλες οι ομάδες μας είναι χτισμένες γύρω από μεμονωμένα συστήματα πληροφοριών, μικροϋπηρεσίες και μέτωπα, επομένως οι ομάδες δεν βλέπουν τη συνολική υγεία ολόκληρου του συστήματος στο σύνολό του. Για παράδειγμα, μπορεί να μην γνωρίζουν πώς κάποιο μικρό μέρος στο βαθύ backend επηρεάζει το μπροστινό άκρο. Το εύρος των ενδιαφερόντων τους περιορίζεται στα συστήματα με τα οποία είναι ενσωματωμένο το σύστημά τους. Εάν μια ομάδα και η υπηρεσία της Α δεν έχουν σχεδόν καμία σχέση με την υπηρεσία Β, τότε μια τέτοια υπηρεσία είναι σχεδόν αόρατη για την ομάδα.

Παρακολούθηση Sportmaster - πώς και με τι

Η ομάδα μας, με τη σειρά της, εργάζεται με συστήματα που είναι πολύ έντονα ενσωματωμένα μεταξύ τους: υπάρχουν πολλές συνδέσεις μεταξύ τους, αυτή είναι μια πολύ μεγάλη υποδομή. Και η λειτουργία του ηλεκτρονικού καταστήματος εξαρτάται από όλα αυτά τα συστήματα (από τα οποία έχουμε, παρεμπιπτόντως, έναν τεράστιο αριθμό).

Αποδεικνύεται λοιπόν ότι το τμήμα μας δεν ανήκει σε καμία ομάδα, αλλά βρίσκεται λίγο στο πλάι. Σε όλη αυτή την ιστορία, το καθήκον μας είναι να κατανοήσουμε πλήρως πώς λειτουργούν τα συστήματα πληροφοριών, τη λειτουργικότητά τους, τις ενσωματώσεις, το λογισμικό, το δίκτυο, το υλικό και πώς όλα αυτά συνδέονται μεταξύ τους.

Η πλατφόρμα στην οποία λειτουργούν τα ηλεκτρονικά μας καταστήματα έχει ως εξής:

  • εμπρός
  • μεσαίο γραφείο
  • back-office

Όσο κι αν θα θέλαμε, δεν συμβαίνει όλα τα συστήματα να λειτουργούν ομαλά και άψογα. Το θέμα, πάλι, είναι ο αριθμός των συστημάτων και των ενσωματώσεων - με κάτι σαν το δικό μας, ορισμένα περιστατικά είναι αναπόφευκτα, παρά την ποιότητα των δοκιμών. Εξάλλου, τόσο μέσα σε ένα ξεχωριστό σύστημα όσο και ως προς την ένταξή τους. Και πρέπει να παρακολουθείτε πλήρως την κατάσταση ολόκληρης της πλατφόρμας, και όχι μόνο οποιουδήποτε μεμονωμένου μέρους της.

Στην ιδανική περίπτωση, η παρακολούθηση της υγείας σε όλη την πλατφόρμα θα πρέπει να είναι αυτοματοποιημένη. Και καταλήξαμε στην παρακολούθηση ως αναπόφευκτο μέρος αυτής της διαδικασίας. Αρχικά, κατασκευάστηκε μόνο για το τμήμα της πρώτης γραμμής, ενώ οι ειδικοί δικτύων, οι διαχειριστές λογισμικού και υλικού είχαν και εξακολουθούν να έχουν τα δικά τους συστήματα παρακολούθησης στρώμα προς επίπεδο. Όλοι αυτοί οι άνθρωποι παρακολούθησαν την παρακολούθηση μόνο στο δικό τους επίπεδο· ούτε κανείς είχε πλήρη κατανόηση.

Για παράδειγμα, εάν μια εικονική μηχανή καταρρεύσει, στις περισσότερες περιπτώσεις μόνο ο διαχειριστής που είναι υπεύθυνος για το υλικό και την εικονική μηχανή γνωρίζει γι' αυτό. Σε τέτοιες περιπτώσεις, η ομάδα πρώτης γραμμής είδε το ίδιο το γεγονός της συντριβής της εφαρμογής, αλλά δεν είχε δεδομένα σχετικά με τη συντριβή της εικονικής μηχανής. Και ο διαχειριστής μπορεί να γνωρίζει ποιος είναι ο πελάτης και να έχει μια γενική ιδέα για το τι τρέχει αυτήν τη στιγμή σε αυτήν την εικονική μηχανή, υπό την προϋπόθεση ότι πρόκειται για κάποιο είδος μεγάλου έργου. Πιθανότατα να μην ξέρει για τα μικρά. Σε κάθε περίπτωση, ο διαχειριστής πρέπει να πάει στον ιδιοκτήτη και να ρωτήσει τι υπήρχε σε αυτό το μηχάνημα, τι πρέπει να αποκατασταθεί και τι πρέπει να αλλάξει. Και αν κάτι πραγματικά σοβαρό χάλασε, άρχισαν να τρέχουν σε κύκλους - γιατί κανείς δεν έβλεπε το σύστημα ως σύνολο.

Τελικά, τέτοιες διαφορετικές ιστορίες επηρεάζουν ολόκληρο το frontend, τους χρήστες και τη βασική επιχειρηματική μας λειτουργία - τις διαδικτυακές πωλήσεις. Δεδομένου ότι δεν είμαστε μέλος μιας ομάδας, αλλά ασχολούμαστε με τη λειτουργία όλων των εφαρμογών ηλεκτρονικού εμπορίου ως μέρος ενός ηλεκτρονικού καταστήματος, αναλάβαμε τη δημιουργία ενός ολοκληρωμένου συστήματος παρακολούθησης για την πλατφόρμα ηλεκτρονικού εμπορίου.

Δομή και στοίβα συστήματος

Ξεκινήσαμε με τον εντοπισμό πολλών επιπέδων παρακολούθησης για τα συστήματά μας, εντός των οποίων θα έπρεπε να συλλέγουμε μετρήσεις. Και όλα αυτά έπρεπε να συνδυαστούν, κάτι που κάναμε στο πρώτο στάδιο. Τώρα σε αυτό το στάδιο ολοκληρώνουμε τη συλλογή μετρήσεων υψηλότερης ποιότητας σε όλα τα επίπεδα μας, προκειμένου να οικοδομήσουμε έναν συσχετισμό και να κατανοήσουμε πώς τα συστήματα επηρεάζουν το ένα το άλλο.

Η έλλειψη ολοκληρωμένης παρακολούθησης στα αρχικά στάδια της κυκλοφορίας της εφαρμογής (από τότε που ξεκινήσαμε την κατασκευή της όταν τα περισσότερα συστήματα ήταν σε παραγωγή) οδήγησε στο γεγονός ότι είχαμε σημαντικό τεχνικό χρέος για να ρυθμίσουμε την παρακολούθηση ολόκληρης της πλατφόρμας. Δεν είχαμε την πολυτέλεια να επικεντρωθούμε στη ρύθμιση παρακολούθησης για ένα IS και στην επεξεργασία παρακολούθησης για αυτό λεπτομερώς, καθώς τα υπόλοιπα συστήματα θα έμεναν χωρίς παρακολούθηση για κάποιο χρονικό διάστημα. Για να λύσουμε αυτό το πρόβλημα, εντοπίσαμε μια λίστα με τις πιο απαραίτητες μετρήσεις για την αξιολόγηση της κατάστασης του πληροφοριακού συστήματος ανά επίπεδο και αρχίσαμε να την εφαρμόζουμε.

Ως εκ τούτου, αποφάσισαν να φάνε τον ελέφαντα τμηματικά.

Το σύστημά μας αποτελείται από:

  • σκεύη, εξαρτήματα;
  • λειτουργικό σύστημα;
  • λογισμικό;
  • Μέρη διεπαφής χρήστη στην εφαρμογή παρακολούθησης.
  • επιχειρηματικές μετρήσεις?
  • εφαρμογές ολοκλήρωσης·
  • ασφάλεια πληροφοριών·
  • δίκτυα·
  • εξισορροπητής κυκλοφορίας.

Παρακολούθηση Sportmaster - πώς και με τι

Στο κέντρο αυτού του συστήματος βρίσκεται η ίδια η παρακολούθηση. Για να κατανοήσετε γενικά την κατάσταση ολόκληρου του συστήματος, πρέπει να γνωρίζετε τι συμβαίνει με τις εφαρμογές σε όλα αυτά τα επίπεδα και σε ολόκληρο το σύνολο των εφαρμογών.

Λοιπόν, σχετικά με τη στοίβα.

Παρακολούθηση Sportmaster - πώς και με τι

Χρησιμοποιούμε λογισμικό ανοιχτού κώδικα. Στο κέντρο έχουμε το Zabbix, το οποίο χρησιμοποιούμε κυρίως ως σύστημα ειδοποίησης. Όλοι γνωρίζουν ότι είναι ιδανικό για παρακολούθηση υποδομών. Τι σημαίνει αυτό? Ακριβώς αυτές οι μετρήσεις χαμηλού επιπέδου που έχει κάθε εταιρεία που διατηρεί το δικό της κέντρο δεδομένων (και η Sportmaster έχει τα δικά της κέντρα δεδομένων) - θερμοκρασία διακομιστή, κατάσταση μνήμης, raid, μετρήσεις συσκευών δικτύου.

Έχουμε ενσωματώσει το Zabbix με το Telegram messenger και το Microsoft Teams, τα οποία χρησιμοποιούνται ενεργά σε ομάδες. Το Zabbix καλύπτει το επίπεδο του πραγματικού δικτύου, το υλικό και κάποιο λογισμικό, αλλά δεν είναι πανάκεια. Εμπλουτίζουμε αυτά τα δεδομένα από κάποιες άλλες υπηρεσίες. Για παράδειγμα, σε επίπεδο υλικού, συνδεόμαστε απευθείας μέσω API στο σύστημα εικονικοποίησης μας και συλλέγουμε δεδομένα.

Τι άλλο. Εκτός από το Zabbix, χρησιμοποιούμε το Prometheus, το οποίο μας επιτρέπει να παρακολουθούμε μετρήσεις σε μια εφαρμογή δυναμικού περιβάλλοντος. Δηλαδή, μπορούμε να λαμβάνουμε μετρήσεις εφαρμογών μέσω ενός τερματικού σημείου HTTP και να μην ανησυχούμε για το ποιες μετρήσεις θα φορτώσουμε σε αυτό και ποιες όχι. Με βάση αυτά τα δεδομένα, μπορούν να αναπτυχθούν αναλυτικά ερωτήματα.

Οι πηγές δεδομένων για άλλα επίπεδα, για παράδειγμα, οι μετρήσεις επιχειρήσεων, χωρίζονται σε τρία στοιχεία.

Πρώτον, αυτά είναι εξωτερικά επιχειρηματικά συστήματα, το Google Analytics, συλλέγουμε μετρήσεις από αρχεία καταγραφής. Από αυτά παίρνουμε δεδομένα για ενεργούς χρήστες, μετατροπές και οτιδήποτε άλλο σχετίζεται με την επιχείρηση. Δεύτερον, αυτό είναι ένα σύστημα παρακολούθησης διεπαφής χρήστη. Θα πρέπει να περιγραφεί με περισσότερες λεπτομέρειες.

Κάποτε ξεκινήσαμε με τις χειροκίνητες δοκιμές και εξελίχθηκε σε αυτόματες δοκιμές λειτουργικότητας και ενσωματώσεων. Από αυτό κάναμε παρακολούθηση, αφήνοντας μόνο την κύρια λειτουργικότητα και βασιστήκαμε σε δείκτες που είναι όσο το δυνατόν πιο σταθεροί και δεν αλλάζουν συχνά με την πάροδο του χρόνου.

Η νέα δομή της ομάδας σημαίνει ότι όλες οι δραστηριότητες εφαρμογής περιορίζονται σε ομάδες προϊόντων, επομένως σταματήσαμε να κάνουμε καθαρές δοκιμές. Αντίθετα, πραγματοποιήσαμε παρακολούθηση διεπαφής χρήστη από τις δοκιμές, γραμμένες σε Java, Selenium και Jenkins (χρησιμοποιείται ως σύστημα για την εκκίνηση και τη δημιουργία αναφορών).

Κάναμε πολλές δοκιμές, αλλά στο τέλος αποφασίσαμε να πάμε στον κεντρικό δρόμο, τη μέτρηση ανώτατου επιπέδου. Και αν έχουμε πολλά συγκεκριμένα τεστ, θα είναι δύσκολο να διατηρήσουμε τα δεδομένα ενημερωμένα. Κάθε επόμενη έκδοση θα σπάσει σημαντικά ολόκληρο το σύστημα και το μόνο που θα κάνουμε είναι να το διορθώσουμε. Ως εκ τούτου, εστιάσαμε σε πολύ θεμελιώδη πράγματα που σπάνια αλλάζουν και τα παρακολουθούμε μόνο.

Τέλος, τρίτον, η πηγή δεδομένων είναι ένα κεντρικό σύστημα καταγραφής. Χρησιμοποιούμε Elastic Stack για αρχεία καταγραφής και, στη συνέχεια, μπορούμε να τραβήξουμε αυτά τα δεδομένα στο σύστημα παρακολούθησης για μετρήσεις επιχειρήσεων. Εκτός από όλα αυτά, έχουμε τη δική μας υπηρεσία Monitoring API, γραμμένη σε Python, η οποία υποβάλλει ερωτήματα σε οποιεσδήποτε υπηρεσίες μέσω API και συλλέγει δεδομένα από αυτές στο Zabbix.

Ένα άλλο απαραίτητο χαρακτηριστικό της παρακολούθησης είναι η οπτικοποίηση. Το δικό μας βασίζεται στη Γραφάνα. Ξεχωρίζει μεταξύ άλλων συστημάτων οπτικοποίησης, καθώς σας επιτρέπει να οπτικοποιείτε μετρήσεις από διαφορετικές πηγές δεδομένων στον πίνακα εργαλείων. Μπορούμε να συλλέξουμε μετρήσεις ανώτατου επιπέδου για ένα ηλεκτρονικό κατάστημα, για παράδειγμα, τον αριθμό των παραγγελιών που έγιναν την τελευταία ώρα από το DBMS, μετρήσεις απόδοσης για το λειτουργικό σύστημα στο οποίο εκτελείται αυτό το ηλεκτρονικό κατάστημα από το Zabbix και μετρήσεις για περιπτώσεις αυτής της εφαρμογής από τον Προμηθέα. Και όλα αυτά θα είναι σε ένα ταμπλό. Καθαρό και προσβάσιμο.

Επιτρέψτε μου να σημειώσω σχετικά με την ασφάλεια - επί του παρόντος ολοκληρώνουμε το σύστημα, το οποίο αργότερα θα ενσωματώσουμε στο παγκόσμιο σύστημα παρακολούθησης. Κατά τη γνώμη μου, τα κύρια προβλήματα που αντιμετωπίζει το ηλεκτρονικό εμπόριο στον τομέα της ασφάλειας πληροφοριών σχετίζονται με τα bots, τους αναλυτές και την ωμή βία. Πρέπει να το προσέχουμε αυτό, γιατί όλα αυτά μπορούν να επηρεάσουν κρίσιμα τόσο τη λειτουργία των εφαρμογών μας όσο και τη φήμη μας από επιχειρηματική άποψη. Και με την επιλεγμένη στοίβα καλύπτουμε με επιτυχία αυτές τις εργασίες.

Ένα άλλο σημαντικό σημείο είναι ότι το στρώμα εφαρμογής συναρμολογείται από τον Prometheus. Ο ίδιος είναι επίσης ενσωματωμένος με το Zabbix. Και έχουμε επίσης το sitespeed, μια υπηρεσία που μας επιτρέπει να βλέπουμε παραμέτρους όπως η ταχύτητα φόρτωσης της σελίδας μας, τα σημεία συμφόρησης, η απόδοση σελίδας, η φόρτωση σεναρίων κ.λπ., είναι επίσης ενσωματωμένο API. Έτσι, οι μετρήσεις μας συλλέγονται στο Zabbix, και κατά συνέπεια, ειδοποιούμε και από εκεί. Όλες οι ειδοποιήσεις αποστέλλονται προς το παρόν στις κύριες μεθόδους αποστολής (προς το παρόν είναι email και τηλεγράφημα, πρόσφατα συνδέθηκε και το MS Teams). Υπάρχουν σχέδια για αναβάθμιση της ειδοποίησης σε τέτοια κατάσταση ώστε τα έξυπνα ρομπότ να λειτουργούν ως υπηρεσία και να παρέχουν πληροφορίες παρακολούθησης σε όλες τις ενδιαφερόμενες ομάδες προϊόντων.

Για εμάς, οι μετρήσεις είναι σημαντικές όχι μόνο για μεμονωμένα συστήματα πληροφοριών, αλλά και γενικές μετρήσεις για ολόκληρη την υποδομή που χρησιμοποιούν οι εφαρμογές: συμπλέγματα φυσικών διακομιστών στους οποίους λειτουργούν εικονικές μηχανές, εξισορροπητές κυκλοφορίας, εξισορροπητές φόρτου δικτύου, το ίδιο το δίκτυο, χρήση καναλιών επικοινωνίας . Συν μετρήσεις για τα δικά μας κέντρα δεδομένων (έχουμε αρκετά από αυτά και η υποδομή είναι αρκετά μεγάλη).

Παρακολούθηση Sportmaster - πώς και με τι

Τα πλεονεκτήματα του συστήματος παρακολούθησης είναι ότι με τη βοήθειά του βλέπουμε την κατάσταση της υγείας όλων των συστημάτων και μπορούμε να αξιολογήσουμε τον αντίκτυπό τους το ένα στο άλλο και στους κοινόχρηστους πόρους. Και τελικά, μας επιτρέπει να εμπλακούμε στον προγραμματισμό πόρων, κάτι που είναι και δική μας ευθύνη. Διαχειριζόμαστε πόρους διακομιστή - μια ομάδα στο ηλεκτρονικό εμπόριο, προμηθεύουμε και παροπλίζουμε νέο εξοπλισμό, αγοράζουμε πρόσθετο νέο εξοπλισμό, διενεργούμε έλεγχο χρήσης πόρων κ.λπ. Κάθε χρόνο, οι ομάδες σχεδιάζουν νέα έργα, αναπτύσσουν τα συστήματά τους και είναι σημαντικό για εμάς να τους παρέχουμε πόρους.

Και με τη βοήθεια των μετρήσεων, βλέπουμε την τάση στην κατανάλωση πόρων από τα πληροφοριακά μας συστήματα. Και με βάση αυτά μπορούμε να σχεδιάσουμε κάτι. Σε επίπεδο εικονικοποίησης, συλλέγουμε δεδομένα και βλέπουμε πληροφορίες για τον διαθέσιμο όγκο πόρων ανά κέντρο δεδομένων. Και ήδη μέσα στο κέντρο δεδομένων μπορείτε να δείτε την ανακύκλωση, την πραγματική διανομή και την κατανάλωση των πόρων. Επιπλέον, τόσο με αυτόνομους διακομιστές όσο και με εικονικές μηχανές και συμπλέγματα φυσικών διακομιστών στους οποίους όλες αυτές οι εικονικές μηχανές περιστρέφονται δυναμικά.

Προοπτικές

Τώρα έχουμε έτοιμο τον πυρήνα του συστήματος στο σύνολό του, αλλά υπάρχουν ακόμη πολλά πράγματα που πρέπει να δουλέψουμε ακόμα. Τουλάχιστον, αυτό είναι ένα επίπεδο ασφάλειας πληροφοριών, αλλά είναι επίσης σημαντικό να φτάσετε στο δίκτυο, να αναπτύξετε ειδοποίηση και να επιλύσετε το ζήτημα της συσχέτισης. Έχουμε πολλά επίπεδα και συστήματα, και σε κάθε επίπεδο υπάρχουν πολλές περισσότερες μετρήσεις. Αποδεικνύεται ότι είναι μια matryoshka στον βαθμό μιας matryoshka.

Το καθήκον μας είναι να κάνουμε τελικά τις σωστές ειδοποιήσεις. Για παράδειγμα, αν υπήρχε πρόβλημα με το υλικό, πάλι, με μια εικονική μηχανή, και υπήρχε μια σημαντική εφαρμογή και δεν δημιουργήθηκε αντίγραφο ασφαλείας της υπηρεσίας με κανέναν τρόπο. Ανακαλύπτουμε ότι η εικονική μηχανή έχει πεθάνει. Στη συνέχεια, οι επιχειρηματικές μετρήσεις θα σας ειδοποιήσουν: οι χρήστες έχουν εξαφανιστεί κάπου, δεν υπάρχει μετατροπή, η διεπαφή χρήστη στη διεπαφή δεν είναι διαθέσιμη, το λογισμικό και οι υπηρεσίες έχουν επίσης πεθάνει.

Σε αυτήν την περίπτωση, θα λαμβάνουμε ανεπιθύμητα μηνύματα από ειδοποιήσεις και αυτό δεν ταιριάζει πλέον στη μορφή ενός κατάλληλου συστήματος παρακολούθησης. Τίθεται το ζήτημα της συσχέτισης. Επομένως, ιδανικά, το σύστημα παρακολούθησής μας θα έπρεπε να λέει: «Παιδιά, η φυσική σας μηχανή πέθανε και μαζί της αυτή η εφαρμογή και αυτές οι μετρήσεις», με τη βοήθεια μιας ειδοποίησης, αντί να μας βομβαρδίζει μανιωδώς με εκατό ειδοποιήσεις. Θα πρέπει να αναφέρει το κύριο πράγμα - την αιτία, η οποία βοηθά στη γρήγορη εξάλειψη του προβλήματος λόγω του εντοπισμού του.

Το σύστημα ειδοποιήσεων και η επεξεργασία ειδοποιήσεων βασίζεται σε μια XNUMXωρη υπηρεσία τηλεφωνικής γραμμής. Όλες οι ειδοποιήσεις που θεωρούνται must και περιλαμβάνονται στη λίστα ελέγχου αποστέλλονται εκεί. Κάθε ειδοποίηση πρέπει να έχει μια περιγραφή: τι συνέβη, τι σημαίνει στην πραγματικότητα, τι επηρεάζει. Και επίσης ένας σύνδεσμος προς τον πίνακα ελέγχου και οδηγίες για το τι πρέπει να κάνετε σε αυτήν την περίπτωση.

Όλα αυτά αφορούν τις απαιτήσεις για τη δημιουργία μιας προειδοποίησης. Τότε η κατάσταση μπορεί να εξελιχθεί σε δύο κατευθύνσεις - είτε υπάρχει πρόβλημα και πρέπει να λυθεί, είτε υπήρξε βλάβη στο σύστημα παρακολούθησης. Αλλά σε κάθε περίπτωση, πρέπει να πάτε και να το καταλάβετε.

Κατά μέσο όρο, τώρα λαμβάνουμε περίπου εκατό ειδοποιήσεις την ημέρα, λαμβάνοντας υπόψη το γεγονός ότι ο συσχετισμός των ειδοποιήσεων δεν έχει ακόμη διαμορφωθεί σωστά. Και αν χρειαστεί να εκτελέσουμε τεχνικές εργασίες, και σβήσουμε με το ζόρι κάτι, ο αριθμός τους αυξάνεται σημαντικά.

Εκτός από την παρακολούθηση των συστημάτων που λειτουργούμε και τη συλλογή μετρήσεων που θεωρούνται σημαντικές από την πλευρά μας, το σύστημα παρακολούθησης μας επιτρέπει να συλλέγουμε δεδομένα για ομάδες προϊόντων. Μπορούν να επηρεάσουν τη σύνθεση των μετρήσεων στα συστήματα πληροφοριών που παρακολουθούμε.

Ο συνάδελφός μας μπορεί να έρθει και να ζητήσει να προσθέσει κάποια μέτρηση που θα είναι χρήσιμη τόσο για εμάς όσο και για την ομάδα. Ή, για παράδειγμα, η ομάδα μπορεί να μην έχει αρκετές από τις βασικές μετρήσεις που έχουμε· πρέπει να παρακολουθεί ορισμένες συγκεκριμένες. Στη Γραφάνα, δημιουργούμε έναν χώρο για κάθε ομάδα και παραχωρούμε δικαιώματα διαχειριστή. Επίσης, εάν μια ομάδα χρειάζεται πίνακες εργαλείων, αλλά η ίδια δεν μπορεί/δεν ξέρει πώς να το κάνει, τη βοηθάμε.

Δεδομένου ότι βρισκόμαστε εκτός της ροής της δημιουργίας αξίας της ομάδας, των εκδόσεων και του προγραμματισμού της, καταλήγουμε σταδιακά στο συμπέρασμα ότι οι εκδόσεις όλων των συστημάτων είναι απρόσκοπτες και μπορούν να κυκλοφορούν καθημερινά χωρίς συντονισμό μαζί μας. Και είναι σημαντικό για εμάς να παρακολουθούμε αυτές τις εκδόσεις, επειδή θα μπορούσαν ενδεχομένως να επηρεάσουν τη λειτουργία της εφαρμογής και να σπάσουν κάτι, και αυτό είναι κρίσιμο. Για τη διαχείριση των εκδόσεων, χρησιμοποιούμε το Bamboo, από όπου λαμβάνουμε δεδομένα μέσω API και μπορούμε να δούμε ποιες εκδόσεις έχουν κυκλοφορήσει σε ποια συστήματα πληροφοριών και την κατάστασή τους. Και το πιο σημαντικό είναι ποια ώρα. Επιθέτουμε δείκτες απελευθέρωσης στις κύριες κρίσιμες μετρήσεις, κάτι που είναι οπτικά πολύ ενδεικτικό σε περίπτωση προβλημάτων.

Με αυτόν τον τρόπο μπορούμε να δούμε τη συσχέτιση μεταξύ των νέων εκδόσεων και των αναδυόμενων προβλημάτων. Η κύρια ιδέα είναι να κατανοήσετε πώς λειτουργεί το σύστημα σε όλα τα επίπεδα, να εντοπίσετε γρήγορα το πρόβλημα και να το διορθώσετε το ίδιο γρήγορα. Εξάλλου, συμβαίνει συχνά αυτό που απαιτεί περισσότερο χρόνο να μην είναι η επίλυση του προβλήματος, αλλά η αναζήτηση της αιτίας.

Και σε αυτόν τον τομέα στο μέλλον θέλουμε να εστιάσουμε στην προορατικότητα. Στην ιδανική περίπτωση, θα ήθελα να μάθω για ένα πρόβλημα που πλησιάζει εκ των προτέρων, και όχι εκ των υστέρων, ώστε να μπορώ να το προλάβω αντί να το λύσω. Μερικές φορές προκύπτουν ψευδείς συναγερμοί του συστήματος παρακολούθησης, τόσο λόγω ανθρώπινου λάθους όσο και λόγω αλλαγών στην εφαρμογή. Και εργαζόμαστε πάνω σε αυτό, το διορθώνουμε και προσπαθούμε να προειδοποιήσουμε τους χρήστες που το χρησιμοποιούν μαζί μας σχετικά με αυτό πριν από κάθε χειρισμό του συστήματος παρακολούθησης , ή πραγματοποιήστε αυτές τις δραστηριότητες στο τεχνικό παράθυρο.

Λοιπόν, το σύστημα έχει ξεκινήσει και λειτουργεί με επιτυχία από τις αρχές της άνοιξης... και παρουσιάζει πολύ πραγματικά κέρδη. Φυσικά, αυτή δεν είναι η τελική του έκδοση· θα παρουσιάσουμε πολλές ακόμη χρήσιμες λειτουργίες. Αλλά αυτή τη στιγμή, με τόσες πολλές ενσωματώσεις και εφαρμογές, η αυτοματοποίηση παρακολούθησης είναι πραγματικά αναπόφευκτη.

Εάν παρακολουθείτε επίσης μεγάλα έργα με σημαντικό αριθμό ενσωματώσεων, γράψτε στα σχόλια ποια ασημένια κουκκίδα βρήκατε για αυτό.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο