Surveillance dans le centre de données : comment nous avons remplacé l'ancien BMS par un nouveau. Partie 1

Surveillance dans le centre de données : comment nous avons remplacé l'ancien BMS par un nouveau. Partie 1

Qu'est-ce que le BMS

Le système de surveillance du fonctionnement des systèmes d'ingénierie dans un centre de données est un élément clé de l'infrastructure, affectant directement un indicateur aussi important pour un centre de données que la rapidité de réponse du personnel aux situations d'urgence et, par conséquent, la durée de fonctionnement ininterrompu. 

Les systèmes de surveillance BMS (Building Monitoring System) sont proposés par de nombreux fournisseurs mondiaux d'équipements pour centres de données. Au cours des travaux de Linxdatacenter en Russie, nous avons eu l'occasion de nous familiariser avec différents systèmes et de rencontrer des approches diamétralement opposées des fournisseurs quant au fonctionnement de ces systèmes. 

Nous vous expliquons comment nous avons complètement mis à jour notre système BMS au cours de la dernière année et pourquoi.  

Racine du problème

Tout a commencé il y a 10 ans avec le lancement du centre de données Linxdatacenter à Saint-Pétersbourg. Le système BMS, selon les normes industrielles de ces années-là, était un serveur physique avec un logiciel installé, accessible via un programme client (le client dit « lourd »). 

À cette époque, peu d’entreprises proposaient de telles solutions sur le marché. Leurs produits étaient la norme, la seule réponse à un besoin existant. Et nous devons leur rendre justice : à l'époque comme aujourd'hui, les leaders du marché s'acquittent généralement de leur tâche fondamentale : fournir des solutions fonctionnelles pour l'exploitation des centres de données. 

Le choix logique pour nous était la solution BMS de l'un des plus grands fabricants mondiaux. Le système choisi à l'époque répondait à toutes les exigences pour surveiller une installation d'ingénierie complexe, telle qu'un centre de données. 

Cependant, au fil du temps, les exigences et les attentes des utilisateurs (c'est-à-dire nous, opérateurs de centres de données) à l'égard des solutions informatiques ont changé. Et les grands fournisseurs, comme le montre l'analyse du marché des solutions proposées, n'étaient pas prêts pour cela.

Le marché de l'informatique d'entreprise a subi une sérieuse influence de la part du secteur B2C. Les solutions numériques d'aujourd'hui doivent offrir une expérience confortable à l'utilisateur final - c'est l'objectif que se sont fixés les développeurs. Cela est évident dans les améliorations apportées aux interfaces utilisateur (UI) et à l’expérience utilisateur (UX) de nombreuses applications d’entreprise. 

Une personne s'habitue au confort de tout ce qui touche aux outils numériques dans la vie quotidienne et impose les mêmes exigences aux outils qu'elle utilise pour ses tâches professionnelles. Les utilisateurs attendent des applications d'entreprise la même visibilité, la même intuitivité, la même simplicité et la même transparence que celles dont ils disposent dans les services financiers, les appels de taxi ou les achats en ligne. Les informaticiens mettant en œuvre des solutions dans un environnement d'entreprise s'efforcent également de recevoir tous les « avantages » modernes : déploiement et mise à l'échelle simples, tolérance aux pannes et possibilités de personnalisation illimitées. 

Les grands fournisseurs internationaux négligent souvent ces tendances. S'appuyant sur leur autorité de longue date dans le secteur, les entreprises se révèlent souvent catégoriques et inflexibles lorsqu'elles travaillent avec les clients. L'illusion de leur propre caractère indispensable ne leur permet pas de voir comment de jeunes entreprises technologiques apparaissent littéralement sous leur nez, proposant des solutions alternatives adaptées à un client spécifique, et sans surpayer la marque.

Inconvénients de l'ancien système BMS 

Pour nous, le principal inconvénient de la solution BMS obsolète existante était son fonctionnement lent. L'enquête sur plusieurs événements pour lesquels le personnel en service ne répondait pas assez rapidement nous a permis de comprendre qu'il y avait parfois un retard important dans l'affichage des événements dans le BMS. Dans le même temps, le système n'était ni surchargé ni défectueux, c'était simplement que les versions de ses composants (par exemple, JAVA) étaient obsolètes et ne pouvaient pas fonctionner correctement avec les nouvelles versions des systèmes d'exploitation sans mises à jour. Ils ne pouvaient être mis à jour qu'avec le système BMS, et le fournisseur n'a pas assuré la continuité automatique des versions, c'est-à-dire que pour nous, le processus serait presque aussi laborieux que le passage à un nouveau système, et la nouvelle solution a conservé une partie des les défauts de l'ancien.  

Ajoutons ici quelques « petites choses » plus désagréables :

  1. Paiement pour la connexion de nouveaux appareils selon le principe « une adresse IP – une licence payante » ; 
  2. Incapacité de mettre à jour le logiciel sans acheter un package de support (cela signifie mettre à jour les composants gratuits et éliminer les erreurs dans le programme BMS lui-même) ;
  3. Coût élevé du support ; 
  4. Localisation sur un serveur « fer », qui peut tomber en panne et dispose de ressources informatiques limitées ;
  5. « Redondance » en installant un deuxième serveur matériel avec un package de licence en double. Dans le même temps, il n'y a pas de synchronisation des bases de données entre les serveurs principaux et de sauvegarde - ce qui signifie un transfert manuel des bases de données et une longue période de transition vers la sauvegarde ;
  6. Client utilisateur « épais », inaccessible de l’extérieur, sans extension pour appareil mobile et possibilité d’accès à distance ;
  7. Une interface web allégée, sans cartes graphiques ni notifications sonores, accessible de l'extérieur, mais pratiquement inutilisée par les collaborateurs en raison de son manque d'informations ;
  8. Manque d'animation dans l'interface - tous les graphiques sont constitués uniquement d'une image « d'arrière-plan » et d'icônes statiques. Le résultat est un niveau de visibilité globalement faible ;

    Tout ressemblait à ceci :

    Surveillance dans le centre de données : comment nous avons remplacé l'ancien BMS par un nouveau. Partie 1

    Surveillance dans le centre de données : comment nous avons remplacé l'ancien BMS par un nouveau. Partie 1

  9. Une limitation dans la création de capteurs virtuels est que seule la fonction d'addition est disponible, tandis que les modèles de capteurs réels nécessitent la capacité d'effectuer un ensemble d'opérations mathématiques pour des calculs corrects qui reflètent les réalités de fonctionnement ; 
  10. Impossibilité d'obtenir des données en temps réel ou à partir des archives à quelque fin que ce soit (par exemple, pour les afficher dans le compte personnel du client) ;
  11. Manque total de flexibilité et de capacité à modifier quoi que ce soit dans le BMS pour l'adapter aux processus existants du centre de données. 

Exigences pour un nouveau système BMS

Compte tenu de ce qui précède, nos principales exigences étaient les suivantes :

  1. Deux machines indépendantes et redondantes avec synchronisation automatique, fonctionnant sur deux plates-formes cloud différentes dans des centres de données différents (dans notre cas, les centres de données Linxdatacenter de Saint-Pétersbourg et de Moscou) ;
  2. Ajout gratuit de nouveaux appareils ;
  3. Mises à jour gratuites du logiciel et de ses composants (à l'exception des améliorations fonctionnelles) ;
  4. Code open source, nous permettant de supporter le système de manière indépendante en cas de problèmes du côté du développeur ;
  5. La possibilité de recevoir et d'utiliser des données du BMS, par exemple sur un site Internet ou dans votre compte personnel ;
  6. Accès via navigateur WEB sans client lourd ;
  7. Utiliser les comptes d'employés du domaine pour accéder à BMS ;
  8. Disponibilité d'animation et bien d'autres petits et moins petits souhaits qui se matérialisent dans une spécification technique détaillée.

Dernière paille

Surveillance dans le centre de données : comment nous avons remplacé l'ancien BMS par un nouveau. Partie 1

Au moment où nous nous sommes rendu compte que le data center était devenu trop grand pour son BMS, la solution la plus évidente nous a semblé être de mettre à jour le système existant. « Ils ne changent pas de cheval à mi-chemin », n'est-ce pas ? 

Cependant, les grandes entreprises, en règle générale, ne proposent pas de modifications personnalisées à leurs solutions « peaufinées » vieilles de plusieurs décennies, vendues dans des dizaines de pays. Tandis que de jeunes entreprises testent une idée ou un prototype d'un futur produit auprès de consommateurs potentiels et s'appuient sur les commentaires des utilisateurs pour développer le produit, les entreprises continuent de vendre des licences pour un produit autrefois vraiment cool, mais qui, hélas, est aujourd'hui obsolète et rigide.

Et nous avons nous-mêmes ressenti la différence d’approche. Lors de la correspondance avec le fabricant de l'ancien BMS, il est rapidement apparu que la mise à jour du système existant proposée par le vendeur entraînerait en réalité pour nous l'achat d'un nouveau système avec transfert de base de données semi-automatique, coût élevé et pièges lors du transfert, que même le constructeur lui-même ne pouvait pas prévoir. Bien entendu, dans ce cas, le coût du support technique pour la solution mise à jour a augmenté et la nécessité d'acheter des licences lors de l'expansion est restée.

Et le plus désagréable était que le nouveau système ne pouvait pas satisfaire pleinement nos exigences de réservation. Le système BMS mis à jour pourrait être implémenté, comme nous le souhaitions, sur une plateforme cloud, ce qui nous permettrait d'abandonner le matériel, mais l'option de redondance n'était pas incluse dans le prix. Pour sauvegarder les données, nous devrons acheter un deuxième serveur virtuel BMS et un ensemble de licences supplémentaires. Le coût d'une licence étant d'environ 76 $ et le nombre d'adresses IP étant de 1000 76 unités, cela représente 000 XNUMX $ de dépenses supplémentaires rien que pour les licences de la machine de sauvegarde. 

La « cerise » de la nouvelle version de BMS était la nécessité d'acheter des licences supplémentaires « pour tous les appareils », même pour le serveur principal. Ici, il est nécessaire de préciser qu'il existe des appareils connectés au BMS via des passerelles. La passerelle possède une seule adresse IP, mais contrôle plusieurs appareils (10 en moyenne). Dans l'ancien BMS, cela nécessitait une licence par adresse IP de passerelle, les statistiques ressemblaient à ceci : « 1000 1200 adresses IP/licences, 1000 1200 appareils ». Le BMS mis à jour fonctionnait selon un principe différent et les statistiques ressembleraient à ceci : « 200 XNUMX adresses IP, XNUMX XNUMX appareils/licences ». Autrement dit, le fournisseur de la nouvelle version a modifié le principe d'attribution des licences et nous avons dû acheter environ XNUMX licences supplémentaires. 

Le budget « mise à jour » comprenait finalement quatre points : 

  • coût de la version cloud et des services de migration vers celle-ci ; 
  • licences supplémentaires au package existant pour les appareils connectés via des passerelles ;
  • coût de la version cloud de sauvegarde ;  
  • un ensemble de licences pour la machine de sauvegarde. 

Le coût total du projet s'élevait à plus de 100 000 $ ! Sans parler de la nécessité d’acheter des licences pour de nouveaux appareils à l’avenir.

En conséquence, nous avons réalisé qu'il serait plus facile pour nous - et peut-être même moins cher - de commander un système créé à partir de zéro, prenant en compte toutes nos exigences et prévoyant la possibilité d'une modernisation à l'avenir. Mais il fallait encore trouver ceux qui voulaient développer un système aussi complexe, comparer les propositions, sélectionner et parcourir avec le finaliste le chemin des spécifications techniques jusqu'à la mise en œuvre... Découvrez-le très prochainement dans la deuxième partie du document. 

Source: habr.com

Ajouter un commentaire