Παρακολούθηση στο κέντρο δεδομένων: πώς αλλάξαμε το παλιό BMS σε νέο. Μέρος 1ο

Παρακολούθηση στο κέντρο δεδομένων: πώς αλλάξαμε το παλιό BMS σε νέο. Μέρος 1ο

Τι είναι το BMS

Το σύστημα παρακολούθησης για τη λειτουργία των συστημάτων μηχανικής σε ένα κέντρο δεδομένων είναι βασικό στοιχείο της υποδομής, επηρεάζοντας άμεσα έναν τόσο σημαντικό δείκτη για ένα κέντρο δεδομένων όπως η ταχύτητα ανταπόκρισης του προσωπικού σε καταστάσεις έκτακτης ανάγκης και, κατά συνέπεια, η διάρκεια της αδιάλειπτης λειτουργίας. 

Τα συστήματα παρακολούθησης BMS (Building Monitoring System) προσφέρονται από πολλούς παγκόσμιους προμηθευτές εξοπλισμού για κέντρα δεδομένων. Κατά τη διάρκεια των εργασιών του Linxdatacenter στη Ρωσία, είχαμε την ευκαιρία να γνωρίσουμε διαφορετικά συστήματα και να συναντήσουμε εκ διαμέτρου αντίθετες προσεγγίσεις των προμηθευτών στη λειτουργία αυτών των συστημάτων. 

Σας λέμε πώς ενημερώσαμε πλήρως το σύστημα BMS τον περασμένο χρόνο και γιατί.  

Η ρίζα του προβλήματος

Όλα ξεκίνησαν πριν από 10 χρόνια με την κυκλοφορία του κέντρου δεδομένων Linxdatacenter στην Αγία Πετρούπολη. Το σύστημα BMS, σύμφωνα με τα βιομηχανικά πρότυπα εκείνων των χρόνων, ήταν ένας φυσικός διακομιστής με εγκατεστημένο λογισμικό, στον οποίο είχε πρόσβαση μέσω προγράμματος πελάτη (το λεγόμενο «χοντρό» πελάτη). 

Λίγες ήταν οι εταιρείες που πρόσφεραν τέτοιες λύσεις στην αγορά εκείνη την εποχή. Τα προϊόντα τους ήταν το πρότυπο, η μόνη απάντηση σε μια υπάρχουσα ανάγκη. Και πρέπει να τους δώσουμε την τιμητική τους: τόσο τότε όσο και σήμερα, οι ηγέτες της αγοράς αντεπεξέρχονται γενικά στο βασικό τους καθήκον - την παροχή λειτουργικών λύσεων για τη λειτουργία κέντρων δεδομένων. 

Η λογική επιλογή για εμάς ήταν η λύση BMS από έναν από τους μεγαλύτερους κατασκευαστές στον κόσμο. Το επιλεγμένο σύστημα εκείνη την εποχή πληρούσε όλες τις απαιτήσεις για την παρακολούθηση μιας πολύπλοκης μηχανικής εγκατάστασης, όπως ένα κέντρο δεδομένων. 

Ωστόσο, με την πάροδο του χρόνου, οι απαιτήσεις και οι προσδοκίες των χρηστών (δηλαδή εμείς, των χειριστών κέντρων δεδομένων) από τις λύσεις πληροφορικής έχουν αλλάξει. Και οι μεγάλοι πωλητές, όπως φαίνεται από μια ανάλυση της αγοράς για τις προτεινόμενες λύσεις, δεν ήταν έτοιμοι για αυτό.

Η εταιρική αγορά πληροφορικής έχει βιώσει σοβαρή επιρροή από τον τομέα B2C. Οι ψηφιακές λύσεις σήμερα πρέπει να παρέχουν μια άνετη εμπειρία στον τελικό χρήστη - αυτός είναι ο στόχος που θέτουν οι προγραμματιστές για τον εαυτό τους. Αυτό είναι εμφανές στις βελτιώσεις στις διεπαφές χρήστη (UI) και στην εμπειρία χρήστη (UX) πολλών εταιρικών εφαρμογών. 

Ένα άτομο συνηθίζει στην άνεση ό,τι σχετίζεται με ψηφιακά εργαλεία στην καθημερινή ζωή και θέτει τις ίδιες απαιτήσεις στα εργαλεία που χρησιμοποιεί για εργασίες εργασίας. Οι άνθρωποι περιμένουν από τις εταιρικές εφαρμογές την ίδια ορατότητα, διαίσθηση, απλότητα και διαφάνεια που είναι διαθέσιμες σε χρηματοοικονομικές υπηρεσίες, κλήσεις ταξί ή ηλεκτρονικές αγορές. Οι ειδικοί πληροφορικής που εφαρμόζουν λύσεις σε ένα εταιρικό περιβάλλον προσπαθούν επίσης να λάβουν όλα τα σύγχρονα «καλά»: απλή ανάπτυξη και κλιμάκωση, ανοχή σφαλμάτων και απεριόριστες δυνατότητες προσαρμογής. 

Οι μεγάλοι διεθνείς πωλητές συχνά παραβλέπουν αυτές τις τάσεις. Βασιζόμενες στη μακροχρόνια εξουσία τους στον κλάδο, οι εταιρείες συχνά αποδεικνύονται κατηγορηματικές και άκαμπτες όταν εργάζονται με πελάτες. Η ψευδαίσθηση της δικής τους αναγκαιότητας δεν τους επιτρέπει να δουν πώς οι νέες εταιρείες τεχνολογίας εμφανίζονται κυριολεκτικά κάτω από τη μύτη τους, προσφέροντας εναλλακτικές λύσεις προσαρμοσμένες σε έναν συγκεκριμένο πελάτη και χωρίς να πληρώνουν υπερβολικά για τη μάρκα.

Μειονεκτήματα του παλιού συστήματος BMS 

Το κύριο μειονέκτημα της υπάρχουσας ξεπερασμένης λύσης BMS για εμάς ήταν η αργή λειτουργία της. Η διερεύνηση πολλών γεγονότων στα οποία το προσωπικό της υπηρεσίας δεν ανταποκρινόταν αρκετά γρήγορα μας οδήγησε να καταλάβουμε ότι μερικές φορές υπήρχε σημαντική καθυστέρηση στην εμφάνιση συμβάντων στο BMS. Ταυτόχρονα, το σύστημα δεν ήταν υπερφορτωμένο ή ελαττωματικό, απλώς οι εκδόσεις των στοιχείων του (για παράδειγμα, JAVA) ήταν ξεπερασμένες και δεν μπορούσαν να λειτουργήσουν σωστά με νέες εκδόσεις λειτουργικών συστημάτων χωρίς ενημερώσεις. Ήταν δυνατή η ενημέρωσή τους μόνο μαζί με το σύστημα BMS και ο πωλητής δεν παρείχε αυτόματη συνέχεια των εκδόσεων, δηλαδή για εμάς η διαδικασία θα ήταν σχεδόν τόσο εντατική όσο η μετάβαση σε ένα νέο σύστημα και η νέα λύση διατηρήθηκε μερικές από τις ελλείψεις του παλιού.  

Ας προσθέσουμε μερικά ακόμη δυσάρεστα «μικρά πράγματα» εδώ:

  1. Πληρωμή για σύνδεση νέων συσκευών με την αρχή "μία διεύθυνση IP - μία άδεια επί πληρωμή". 
  2. Αδυναμία ενημέρωσης λογισμικού χωρίς την αγορά πακέτου υποστήριξης (αυτό σημαίνει ενημέρωση δωρεάν στοιχείων και εξάλειψη σφαλμάτων στο ίδιο το πρόγραμμα BMS).
  3. Υψηλό κόστος υποστήριξης. 
  4. Τοποθεσία σε έναν «σιδερένιο» διακομιστή, ο οποίος μπορεί να αποτύχει και έχει περιορισμένους υπολογιστικούς πόρους.
  5. "Πλεονασμός" εγκαθιστώντας έναν δεύτερο διακομιστή υλικού με διπλό πακέτο άδειας χρήσης. Ταυτόχρονα, δεν υπάρχει συγχρονισμός των βάσεων δεδομένων μεταξύ του κύριου και του εφεδρικού διακομιστή - πράγμα που σημαίνει μη αυτόματη μεταφορά βάσης δεδομένων και μεγάλο χρονικό διάστημα μετάβασης στο αντίγραφο ασφαλείας.
  6. «Παχύς» πελάτης χρήστη, απρόσιτος από έξω, χωρίς επέκταση για φορητή συσκευή και επιλογή απομακρυσμένης πρόσβασης.
  7. Μια απογυμνωμένη διεπαφή ιστού χωρίς κάρτες γραφικών και ειδοποιήσεις ήχου, προσβάσιμη από το εξωτερικό, αλλά πρακτικά δεν χρησιμοποιείται από τους εργαζόμενους λόγω έλλειψης πληροφοριών.
  8. Έλλειψη κινούμενων εικόνων στη διεπαφή - όλα τα γραφικά αποτελούνται μόνο από μια εικόνα "φόντο" και στατικά εικονίδια. Το αποτέλεσμα είναι ένα γενικά χαμηλό επίπεδο ορατότητας.

    Όλα έμοιαζαν κάπως έτσι:

    Παρακολούθηση στο κέντρο δεδομένων: πώς αλλάξαμε το παλιό BMS σε νέο. Μέρος 1ο

    Παρακολούθηση στο κέντρο δεδομένων: πώς αλλάξαμε το παλιό BMS σε νέο. Μέρος 1ο

  9. Ένας περιορισμός στη δημιουργία εικονικών αισθητήρων είναι ότι είναι διαθέσιμη μόνο η συνάρτηση πρόσθεσης, ενώ τα μοντέλα πραγματικών αισθητήρων απαιτούν τη δυνατότητα εκτέλεσης ενός συνόλου μαθηματικών πράξεων για σωστούς υπολογισμούς που αντικατοπτρίζουν την πραγματικότητα της λειτουργίας. 
  10. Αδυναμία λήψης δεδομένων σε πραγματικό χρόνο ή από το αρχείο για οποιονδήποτε σκοπό (για παράδειγμα, για εμφάνιση στον προσωπικό λογαριασμό του πελάτη).
  11. Παντελής έλλειψη ευελιξίας και ικανότητας αλλαγής οτιδήποτε στο BMS για να ταιριάζει στις υπάρχουσες διαδικασίες του κέντρου δεδομένων. 

Απαιτήσεις για ένα νέο σύστημα BMS

Λαμβάνοντας υπόψη τα παραπάνω, οι βασικές απαιτήσεις μας ήταν οι εξής:

  1. Δύο ανεξάρτητες, αμοιβαία πλεονάζουσες μηχανές με αυτόματο συγχρονισμό, που λειτουργούν σε δύο διαφορετικές πλατφόρμες cloud σε διαφορετικά κέντρα δεδομένων (στην περίπτωσή μας, κέντρα δεδομένων Linxdatacenter Αγίας Πετρούπολης και Μόσχας).
  2. Δωρεάν προσθήκη νέων συσκευών.
  3. Δωρεάν ενημερώσεις λογισμικού και τα στοιχεία του (εκτός από λειτουργικές βελτιώσεις).
  4. Ανοιχτός κώδικας, που μας επιτρέπει να υποστηρίζουμε ανεξάρτητα το σύστημα σε περίπτωση προβλημάτων από την πλευρά του προγραμματιστή.
  5. Η δυνατότητα λήψης και χρήσης δεδομένων από το BMS, για παράδειγμα, σε έναν ιστότοπο ή στον προσωπικό σας λογαριασμό.
  6. Πρόσβαση μέσω προγράμματος περιήγησης WEB χωρίς πυκνό πελάτη.
  7. Χρήση λογαριασμών υπαλλήλων τομέα για πρόσβαση στο BMS.
  8. Διαθεσιμότητα κινουμένων σχεδίων και πολλές άλλες μικρές και όχι τόσο μικρές ευχές που υλοποιήθηκαν σε μια λεπτομερή τεχνική προδιαγραφή.

Τελευταία σταγόνα

Παρακολούθηση στο κέντρο δεδομένων: πώς αλλάξαμε το παλιό BMS σε νέο. Μέρος 1ο

Τη στιγμή που συνειδητοποιήσαμε ότι το κέντρο δεδομένων είχε ξεπεράσει το BMS του, η πιο προφανής λύση μας φάνηκε να ενημερώσουμε το υπάρχον σύστημα. «Δεν αλλάζουν άλογα στη μέση», σωστά; 

Ωστόσο, οι μεγάλες εταιρείες, κατά κανόνα, δεν προσφέρουν προσαρμοσμένες τροποποιήσεις στις δεκαετίες «γυαλισμένες» λύσεις τους που πωλούνται σε δεκάδες χώρες. Ενώ οι νέες εταιρείες δοκιμάζουν μια ιδέα ή πρωτότυπο μελλοντικού προϊόντος σε δυνητικούς καταναλωτές και βασίζονται στα σχόλια των χρηστών για να αναπτύξουν το προϊόν, οι εταιρείες συνεχίζουν να πωλούν άδειες για ένα άλλοτε πολύ ωραίο προϊόν, αλλά, δυστυχώς, σήμερα είναι ξεπερασμένο και άκαμπτο.

Και νιώσαμε τη διαφορά στην προσέγγιση. Κατά τη διάρκεια της αλληλογραφίας με τον κατασκευαστή του παλιού BMS, έγινε γρήγορα σαφές ότι η ενημέρωση του υπάρχοντος συστήματος που προτείνεται από τον πωλητή θα είχε ως αποτέλεσμα την αγορά ενός νέου συστήματος για εμάς με ημιαυτόματη μεταφορά βάσης δεδομένων, υψηλό κόστος και παγίδες κατά τη διάρκεια της μεταφορά, την οποία ούτε ο ίδιος ο κατασκευαστής δεν μπορούσε να προβλέψει. Φυσικά, σε αυτήν την περίπτωση, το κόστος τεχνικής υποστήριξης για την ενημερωμένη λύση αυξήθηκε και η ανάγκη αγοράς αδειών παρέμεινε κατά την επέκταση.

Και το πιο δυσάρεστο ήταν ότι το νέο σύστημα δεν μπορούσε να ικανοποιήσει πλήρως τις απαιτήσεις κράτησης. Το ενημερωμένο σύστημα BMS θα μπορούσε να εφαρμοστεί, όπως θέλαμε, σε μια πλατφόρμα cloud, κάτι που θα μας επέτρεπε να εγκαταλείψουμε το υλικό, αλλά η επιλογή πλεονασμού δεν περιλαμβανόταν στην τιμή. Για να δημιουργήσουμε αντίγραφα ασφαλείας των δεδομένων, θα πρέπει να αγοράσουμε έναν δεύτερο εικονικό διακομιστή BMS και ένα επιπλέον σύνολο αδειών. Με το κόστος μιας άδειας χρήσης να είναι περίπου 76 $ και ο αριθμός των διευθύνσεων IP να είναι 1000 μονάδες, αυτό αθροίζει έως και 76 $ σε πρόσθετα έξοδα μόνο για άδειες χρήσης του εφεδρικού μηχανήματος. 

Το «cherry» στη νέα έκδοση του BMS ήταν η ανάγκη αγοράς πρόσθετων αδειών «για όλες τις συσκευές» – ακόμα και για τον κύριο διακομιστή. Εδώ είναι απαραίτητο να διευκρινιστεί ότι υπάρχουν συσκευές συνδεδεμένες στο BMS μέσω πυλών. Η πύλη έχει μία διεύθυνση IP, αλλά ελέγχει πολλές συσκευές (10 κατά μέσο όρο). Στο παλιό BMS, αυτό απαιτούσε μία άδεια ανά διεύθυνση IP πύλης, τα στατιστικά έμοιαζαν κάπως έτσι: «1000 διευθύνσεις IP/άδειες, 1200 συσκευές». Το ενημερωμένο BMS λειτούργησε με διαφορετική αρχή και τα στατιστικά στοιχεία θα έμοιαζαν ως εξής: «1000 διευθύνσεις IP, 1200 συσκευές/άδειες». Δηλαδή, ο προμηθευτής στη νέα έκδοση άλλαξε την αρχή της εκχώρησης αδειών και έπρεπε να αγοράσουμε περίπου 200 επιπλέον άδειες. 

Ο προϋπολογισμός «ενημέρωσης» αποτελείται τελικά από τέσσερα σημεία: 

  • το κόστος της έκδοσης cloud και των υπηρεσιών μετάβασης σε αυτήν· 
  • πρόσθετες άδειες στο υπάρχον πακέτο για συσκευές συνδεδεμένες μέσω πυλών.
  • κόστος της εφεδρικής έκδοσης cloud.  
  • ένα σύνολο αδειών για το μηχάνημα δημιουργίας αντιγράφων ασφαλείας. 

Το συνολικό κόστος του έργου ήταν πάνω από 100 δολάρια! Και αυτό για να μην αναφέρουμε την ανάγκη αγοράς αδειών για νέες συσκευές στο μέλλον.

Ως αποτέλεσμα, συνειδητοποιήσαμε ότι θα ήταν ευκολότερο για εμάς - και ίσως και φθηνότερο - να παραγγείλουμε ένα σύστημα που δημιουργήθηκε από την αρχή, λαμβάνοντας υπόψη όλες τις απαιτήσεις μας και προβλέποντας τη δυνατότητα εκσυγχρονισμού στο μέλλον. Αλλά όσοι ήθελαν να αναπτύξουν ένα τόσο περίπλοκο σύστημα έπρεπε ακόμα να βρεθούν, να συγκρίνουν προτάσεις, να επιλεγούν και με τον φιναλίστ να βάδισαν το μονοπάτι από τις τεχνικές προδιαγραφές στην υλοποίηση... Διαβάστε σχετικά στο δεύτερο μέρος του υλικού πολύ σύντομα. 

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο