Überwachung im Rechenzentrum: Wie wir das alte BMS auf das neue umgestellt haben. Teil 1

Überwachung im Rechenzentrum: Wie wir das alte BMS auf das neue umgestellt haben. Teil 1

Was ist BMS?

Das Überwachungssystem für den Betrieb technischer Systeme in einem Rechenzentrum ist ein Schlüsselelement der Infrastruktur und beeinflusst direkt einen so wichtigen Indikator für ein Rechenzentrum wie die Reaktionsgeschwindigkeit des Personals in Notfallsituationen und damit die Dauer des unterbrechungsfreien Betriebs. 

BMS-Überwachungssysteme (Building Monitoring System) werden von vielen globalen Anbietern von Geräten für Rechenzentren angeboten. Während der Arbeit von Linxdatacenter in Russland hatten wir die Gelegenheit, verschiedene Systeme kennenzulernen und auf diametral entgegengesetzte Ansätze von Anbietern beim Betrieb dieser Systeme zu stoßen. 

Wir erzählen Ihnen, wie wir im vergangenen Jahr unser BMS-System komplett erneuert haben und warum.  

Wurzel des Problems

Alles begann vor 10 Jahren mit der Eröffnung des Linxdatacenter-Rechenzentrums in St. Petersburg. Das BMS-System war nach damaligen Industriestandards ein physischer Server mit installierter Software, auf den über ein Client-Programm (der sogenannte „Thick“-Client) zugegriffen wurde. 

Zu dieser Zeit gab es auf dem Markt nur wenige Unternehmen, die solche Lösungen anboten. Ihre Produkte waren der Standard, die einzige Antwort auf ein bestehendes Bedürfnis. Und wir müssen ihnen gerecht werden: Sowohl damals als auch heute bewältigen Marktführer in der Regel ihre Grundaufgabe – die Bereitstellung funktionaler Lösungen für den Betrieb von Rechenzentren. 

Die logische Wahl für uns war die BMS-Lösung eines der weltweit größten Hersteller. Das damals ausgewählte System erfüllte alle Anforderungen zur Überwachung einer komplexen technischen Anlage, beispielsweise eines Rechenzentrums. 

Allerdings haben sich im Laufe der Zeit die Anforderungen und Erwartungen der Nutzer (also wir Rechenzentrumsbetreiber) an IT-Lösungen verändert. Und große Anbieter waren darauf nicht vorbereitet, wie eine Analyse des Marktes für die vorgeschlagenen Lösungen zeigt.

Der Unternehmens-IT-Markt hat starken Einfluss aus dem B2C-Bereich erfahren. Digitale Lösungen müssen heute dem Endnutzer ein komfortables Erlebnis bieten – dieses Ziel haben sich Entwickler gesetzt. Dies zeigt sich in den Verbesserungen der Benutzeroberflächen (UI) und der Benutzererfahrung (UX) vieler Unternehmensanwendungen. 

Der Mensch gewöhnt sich im Alltag an den Komfort von allem, was mit digitalen Werkzeugen zu tun hat, und stellt die gleichen Ansprüche an die Werkzeuge, die er für Arbeitsaufgaben nutzt. Menschen erwarten von Unternehmensanwendungen die gleiche Sichtbarkeit, Intuitivität, Einfachheit und Transparenz, die ihnen bei Finanzdienstleistungen, Taxifahrten oder Online-Einkäufen zur Verfügung steht. Auch IT-Spezialisten, die Lösungen in einer Unternehmensumgebung implementieren, streben danach, alle modernen „Goodies“ zu erhalten: einfache Bereitstellung und Skalierung, Fehlertoleranz und unbegrenzte Anpassungsmöglichkeiten. 

Große internationale Anbieter übersehen diese Trends oft. Aufgrund ihrer langjährigen Autorität in der Branche erweisen sich Unternehmen im Umgang mit Kunden oft als kategorisch und unflexibel. Die Illusion ihrer eigenen Unentbehrlichkeit lässt sie nicht erkennen, wie junge Technologieunternehmen buchstäblich vor ihrer Nase auftauchen und alternative Lösungen anbieten, die auf einen bestimmten Kunden zugeschnitten sind, ohne zu viel für die Marke zu bezahlen.

Nachteile des alten BMS-Systems 

Der Hauptnachteil der bestehenden veralteten BMS-Lösung war für uns der langsame Betrieb. Die Untersuchung mehrerer Ereignisse, bei denen das diensthabende Personal nicht schnell genug reagierte, ergab, dass es manchmal zu erheblichen Verzögerungen bei der Anzeige von Ereignissen im BMS kam. Gleichzeitig war das System nicht überlastet oder fehlerhaft, lediglich die Versionen seiner Komponenten (z. B. JAVA) waren veraltet und konnten mit neuen Betriebssystemversionen ohne Updates nicht richtig funktionieren. Die Aktualisierung war nur zusammen mit dem BMS-System möglich und der Anbieter sah keine automatische Versionskontinuität vor, d. h. für uns wäre der Prozess fast so arbeitsintensiv wie der Wechsel zu einem neuen System und die neue Lösung blieb erhalten einige der Mängel des alten.  

Fügen wir hier noch ein paar unangenehme „Kleinigkeiten“ hinzu:

  1. Bezahlung für den Anschluss neuer Geräte nach dem Prinzip „Eine IP-Adresse – eine kostenpflichtige Lizenz“; 
  2. Unfähigkeit, Software zu aktualisieren, ohne ein Support-Paket zu kaufen (das bedeutet, kostenlose Komponenten zu aktualisieren und Fehler im BMS-Programm selbst zu beseitigen);
  3. Hohe Supportkosten; 
  4. Standort auf einem „eisernen“ Server, der ausfallen kann und über begrenzte Rechenressourcen verfügt;
  5. „Redundanz“ durch Installation eines zweiten Hardware-Servers mit doppeltem Lizenzpaket. Gleichzeitig findet keine Synchronisierung der Datenbanken zwischen Haupt- und Backup-Server statt – was eine manuelle Datenbankübertragung und eine lange Übergangszeit zum Backup bedeutet;
  6. „Dicker“ Benutzer-Client, von außen nicht zugänglich, ohne Erweiterung für ein mobiles Gerät und Fernzugriffsmöglichkeit;
  7. Eine abgespeckte Weboberfläche ohne Grafikkarten und akustische Benachrichtigungen, die von außen zugänglich ist, aber aufgrund mangelnder Informationen von Mitarbeitern praktisch nicht genutzt wird;
  8. Fehlende Animationen in der Benutzeroberfläche – alle Grafiken bestehen nur aus einem „Hintergrundbild“ und statischen Symbolen. Das Ergebnis ist eine insgesamt geringe Sichtbarkeit;

    Alles sah ungefähr so ​​aus:

    Überwachung im Rechenzentrum: Wie wir das alte BMS auf das neue umgestellt haben. Teil 1

    Überwachung im Rechenzentrum: Wie wir das alte BMS auf das neue umgestellt haben. Teil 1

  9. Eine Einschränkung bei der Erstellung virtueller Sensoren besteht darin, dass nur die Additionsfunktion verfügbar ist, während Modelle realer Sensoren die Fähigkeit erfordern, eine Reihe mathematischer Operationen durchzuführen, um korrekte Berechnungen durchzuführen, die die Realitäten des Betriebs widerspiegeln. 
  10. Unfähigkeit, Daten zu irgendeinem Zweck in Echtzeit oder aus dem Archiv abzurufen (z. B. zur Anzeige im persönlichen Konto des Kunden);
  11. Völliger Mangel an Flexibilität und Möglichkeit, irgendetwas im BMS zu ändern, um es an bestehende Rechenzentrumsprozesse anzupassen. 

Anforderungen an ein neues BMS-System

Unter Berücksichtigung des oben Gesagten waren unsere Hauptanforderungen wie folgt:

  1. Zwei unabhängige, gegenseitig redundante Maschinen mit automatischer Synchronisierung, die auf zwei verschiedenen Cloud-Plattformen in verschiedenen Rechenzentren laufen (in unserem Fall die Rechenzentren Linxdatacenter St. Petersburg und Moskau);
  2. Kostenlose Hinzufügung neuer Geräte;
  3. Kostenlose Software-Updates und deren Komponenten (ausgenommen Funktionsverbesserungen);
  4. Offener Quellcode, der es uns ermöglicht, das System bei Problemen auf Entwicklerseite unabhängig zu unterstützen;
  5. Die Möglichkeit, Daten vom BMS zu empfangen und zu verwenden, beispielsweise auf einer Website oder in Ihrem persönlichen Konto;
  6. Zugriff über WEB-Browser ohne Thick-Client;
  7. Verwendung von Domänenmitarbeiterkonten für den Zugriff auf BMS;
  8. Verfügbarkeit von Animationen und viele andere kleine und nicht ganz so kleine Wünsche, die sich in einer detaillierten technischen Spezifikation niederschlugen.

Letzter Strohhalm

Überwachung im Rechenzentrum: Wie wir das alte BMS auf das neue umgestellt haben. Teil 1

In dem Moment, als wir merkten, dass das Rechenzentrum seinem BMS entwachsen war, schien uns die Aktualisierung des bestehenden Systems die naheliegendste Lösung zu sein. „Sie wechseln nicht auf halbem Weg das Pferd“, oder? 

Allerdings bieten große Unternehmen in der Regel keine kundenspezifischen Modifikationen ihrer jahrzehntealten „polierten“ Lösungen an, die in Dutzenden von Ländern verkauft werden. Während junge Unternehmen eine Idee oder einen Prototyp eines zukünftigen Produkts an potenziellen Verbrauchern testen und sich bei der Entwicklung des Produkts auf das Feedback der Benutzer verlassen, verkaufen Konzerne weiterhin Lizenzen für ein einst wirklich cooles Produkt, das heute jedoch leider veraltet und unflexibel ist.

Und wir haben den Unterschied in der Herangehensweise selbst gespürt. Bei der Korrespondenz mit dem Hersteller des alten BMS wurde schnell klar, dass das vom Anbieter vorgeschlagene Update des bestehenden Systems für uns tatsächlich die Anschaffung eines neuen Systems mit halbautomatischer Datenbankübertragung, hohen Kosten und Fallstricken bei der Umsetzung nach sich ziehen würde Übertragung, die selbst der Hersteller selbst nicht vorhersagen konnte. Natürlich stiegen in diesem Fall die Kosten für den technischen Support für die aktualisierte Lösung und die Notwendigkeit, während der Erweiterung Lizenzen zu erwerben, blieb bestehen.

Und das Unangenehmste war, dass das neue System unsere Reservierungsanforderungen nicht vollständig erfüllen konnte. Das aktualisierte BMS-System konnte wie gewünscht auf einer Cloud-Plattform implementiert werden, wodurch wir auf die Hardware verzichten konnten, die Redundanzoption war jedoch nicht im Preis enthalten. Um die Daten zu sichern, müssten wir einen zweiten virtuellen BMS-Server und einen zusätzlichen Satz Lizenzen kaufen. Da die Kosten für eine Lizenz etwa 76 US-Dollar betragen und die Anzahl der IP-Adressen 1000 Einheiten beträgt, summieren sich die zusätzlichen Kosten allein für die Lizenzen für die Backup-Maschine auf 76 US-Dollar. 

Das Highlight der neuen BMS-Version war die Notwendigkeit, zusätzliche Lizenzen „für alle Geräte“ zu erwerben – auch für den Hauptserver. Hier muss klargestellt werden, dass Geräte über Gateways mit dem BMS verbunden sind. Das Gateway hat eine IP-Adresse, steuert aber mehrere Geräte (durchschnittlich 10). Im alten BMS war dafür eine Lizenz pro Gateway-IP-Adresse erforderlich, die Statistik sah etwa so aus: „1000 IP-Adressen/Lizenzen, 1200 Geräte.“ Das aktualisierte BMS funktionierte nach einem anderen Prinzip und die Statistik würde so aussehen: „1000 IP-Adressen, 1200 Geräte/Lizenzen.“ Das heißt, der Anbieter hat in der neuen Version das Prinzip der Lizenzvergabe geändert und wir mussten ca. 200 zusätzliche Lizenzen kaufen. 

Das „Update“-Budget bestand letztlich aus vier Punkten: 

  • Kosten der Cloud-Version und Migrationsdienste dazu; 
  • zusätzliche Lizenzen zum bestehenden Paket für über Gateways angebundene Geräte;
  • Kosten für die Backup-Cloud-Version;  
  • eine Reihe von Lizenzen für die Backup-Maschine. 

Die Gesamtkosten des Projekts betrugen mehr als 100 US-Dollar! Ganz zu schweigen davon, dass in Zukunft Lizenzen für neue Geräte erworben werden müssen.

Dadurch wurde uns klar, dass es für uns einfacher – und vielleicht sogar günstiger – wäre, ein von Grund auf neu erstelltes System zu bestellen, das alle unsere Anforderungen berücksichtigt und die Möglichkeit einer zukünftigen Modernisierung vorsieht. Aber diejenigen, die ein so komplexes System entwickeln wollten, mussten noch gefunden, Vorschläge verglichen, ausgewählt und mit dem Finalisten den Weg von der technischen Spezifikation bis zur Umsetzung beschritten werden... Lesen Sie dazu bald im zweiten Teil des Materials. 

Source: habr.com

Kommentar hinzufügen