Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Imaginez que vous disposez d'une salle de serveurs complète d'équipements d'ingénierie : plusieurs dizaines de climatiseurs, un groupe de groupes électrogènes diesel et des alimentations sans coupure. Pour que le matériel fonctionne comme il se doit, vérifiez régulièrement ses performances et n'oubliez pas la maintenance préventive : effectuez des tests, vérifiez le niveau d'huile, changez les pièces. Même pour une seule salle de serveurs, vous devez stocker de nombreuses informations : un registre des équipements, une liste des consommables dans l'entrepôt, un calendrier de maintenance préventive, ainsi que des documents de garantie, des contrats avec les fournisseurs et les sous-traitants. 

Multiplions maintenant le nombre de salles par dix. Des problèmes de logistique sont apparus. Dans quel entrepôt faut-il stocker quoi pour ne pas avoir à courir après chaque pièce de rechange ? Comment réapprovisionner en temps opportun afin que les réparations imprévues ne vous surprennent pas ? S'il y a beaucoup de matériel, il est impossible de garder tout le travail technique en tête, et difficile sur papier. C’est là que le MMS, ou système de gestion de la maintenance, vient à la rescousse. 

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
Chez MMS, nous établissons des plannings pour les travaux de prévention et de réparation et stockons des instructions pour les ingénieurs. Tous les centres de données ne disposent pas d'un tel système ; beaucoup considèrent qu'il s'agit d'une solution trop coûteuse. Mais d'après notre propre expérience, nous sommes convaincus que Ce n'est pas l'outil qui compte, c'est l'approche travailler avec des informations. Nous avons créé le premier système sous Excel et l'avons progressivement développé en un produit logiciel. 

Avec alexdropp nous avons décidé de partager notre expérience dans le développement de notre propre MMS. Je montrerai comment le système s'est développé et comment il a contribué à introduire les meilleures pratiques de maintenance. Alexey vous expliquera comment il a hérité du MMS, ce qui a changé pendant cette période et comment le système facilite désormais la vie des ingénieurs. 

Comment nous sommes arrivés à notre propre MMS

Il y avait d'abord des dossiers. Il y a 8 à 10 ans, les informations étaient stockées sous forme dispersée. Après la maintenance, nous avons signé des rapports sur les travaux terminés, stocké les originaux papier dans des archives et numérisé des copies dans des dossiers réseau. De la même manière, les informations sur les pièces détachées : pièces détachées, outils et accessoires ont été rassemblées dans des dossiers répartis par équipements. C'est ainsi que vous pouvez vivre si vous construisez une structure et des niveaux d'accès pour ces dossiers.
Mais alors vous avez trois problèmes : 

  • navigation : il faut beaucoup de temps pour basculer entre les différents dossiers. Si vous souhaitez voir des réparations sur des équipements spécifiques sur plusieurs années, il faudra faire beaucoup de clics.
  • statistiques : vous ne l’aurez pas, et sans cela, il est difficile de prédire la rapidité avec laquelle les différents équipements tomberont en panne ou le nombre de pièces de rechange à prévoir pour l’année prochaine.  
  • réponse rapide : personne ne vous rappellera que les composants sont déjà épuisés et doivent être commandés à nouveau. Il n’est pas évident non plus que ce ne soit pas la première fois que le même équipement tombe en panne.  

Pendant un moment, nous avons stocké des documents comme celui-ci, puis nous avons découvert Excel :)

MMS vers Excel. Au fil du temps, la structure de la documentation a migré vers Excel. Il s’appuyait sur une liste d’équipements, à laquelle étaient annexés des calendriers de maintenance, des listes de contrôle et des liens vers des certificats d’achèvement des travaux : 

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

La liste des équipements indiquait les principales caractéristiques et l'emplacement dans le data center :
Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Le résultat est une sorte de navigateur à partir duquel vous pouvez rapidement comprendre ce qui se passe avec l'équipement et sa maintenance. Si nécessaire, vous pouvez consulter les actes individuels du calendrier de maintenance en utilisant les liens :

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Si vous maintenez consciencieusement un document dans Excel, la solution est tout à fait adaptée à une petite salle serveur. Mais c’est aussi temporaire. Même si nous utilisons un seul climatiseur et effectuons l’entretien une fois par mois, sur cinq ans, nous accumulerons des centaines d’erreurs et notre Excel gonflera. Si vous ajoutez un autre climatiseur, un générateur diesel, un UPS, vous devez alors créer plusieurs feuilles et les relier entre elles. Plus l’histoire est longue, plus il est difficile de saisir immédiatement les informations nécessaires. 

Le premier système « adulte ». En 2014, nous avons subi le premier audit de gestion et d'exploitation selon les normes de durabilité opérationnelle de l'Uptime Institute. Nous avons utilisé presque le même programme Excel, mais au cours d'un an, nous l'avons considérablement amélioré : nous avons ajouté des liens vers des instructions et des listes de contrôle pour les ingénieurs. Les auditeurs ont trouvé ce format tout à fait réalisable. Ils ont pu suivre toutes les opérations avec l'équipement et s'assurer que les informations étaient à jour et que les processus étaient en place. L'audit s'est ensuite déroulé avec brio, avec une note de 92 points sur 100 possibles.

La question s'est posée : comment vivre plus longtemps. Nous avons décidé que nous avions besoin d'un MMS « sérieux », avons examiné plusieurs programmes payants, mais avons finalement décidé d'écrire le logiciel nous-mêmes. Le même Excel a été utilisé comme spécification technique étendue. Ce sont les tâches que nous avons définies pour MMS. 

Ce que nous attendions de MMS

Dans la plupart des cas, MMS est un ensemble de répertoires et de rapports. Notre hiérarchie de répertoires ressemble à ceci :

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Le tout premier répertoire de niveau supérieur est liste des bâtiments: salles des machines, entrepôts où se trouvent les équipements.

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Vient ensuite liste du matériel d'ingénierie. Nous l'avons collecté selon les systèmes suivants :

  • Système de climatisation : climatiseurs, refroidisseurs, pompes.
  • Système d'alimentation électrique : UPS, groupes électrogènes diesel, tableaux de distribution.

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
Pour chaque équipement nous collectons des données de base : type, modèle, numéro de série, données constructeur, année de fabrication, date de mise en service, période de garantie.

Lorsque nous avons rempli la liste du matériel, nous l'établissons programme d'entretien: comment et à quelle fréquence effectuer la maintenance. Dans le programme de maintenance, nous décrivons ensemble d'opérations, par exemple : remplacer cette batterie, régler le fonctionnement d'une pièce spécifique, etc. Nous décrivons les opérations dans un ouvrage de référence séparé. Si une opération est répétée dans différents programmes, il n'est alors pas nécessaire de la décrire à nouveau à chaque fois - nous en prenons simplement une toute prête dans l'ouvrage de référence :

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
Les opérations « Modification des consignes de température » et « Remplacement des connexions rapides des câbles » seront courantes pour les refroidisseurs et les systèmes de climatisation d'un même fabricant.

Maintenant, pour chaque équipement, nous pouvons créer Calendrier de maintenance. Nous lions le programme de maintenance à un équipement spécifique, et le système lui-même examine dans le programme la fréquence à laquelle la maintenance doit être effectuée et calcule le temps de travail à partir de la date de mise en service :
Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenanceVous pouvez même automatiser la préparation d'un tel planning à l'aide de formules Excel.

Histoire pas tout à fait évidente : nous maintenons un répertoire séparé travail différé. Le calendrier est le calendrier, mais nous sommes tous des personnes vivantes et nous comprenons que tout peut arriver. Par exemple, un consommable n’est pas arrivé à temps et la prestation doit être reprogrammée d’une semaine. C'est une situation normale si vous la surveillez. Nous tenons des statistiques sur les travaux différés et inachevés et essayons de faire en sorte que les annulations de maintenance tendent vers zéro.  

Des statistiques sont également tenues pour chaque équipement accidents et réparations imprévues. Nous utilisons des statistiques pour planifier les achats et trouver les points faibles des infrastructures. Par exemple, si un compresseur grille au même endroit trois fois de suite, c'est un signal pour rechercher la cause de la panne.   

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
Cet historique d'entretien et de réparations s'est accumulé sur 4 ans pour un climatiseur spécifique.

Le guide suivant est Pièces de rechange. Il prend en compte les consommables nécessaires à l'équipement, où et en quelle quantité ils sont stockés. Ici, nous stockons également des informations sur les délais de livraison afin de mieux planifier les arrivées à l'entrepôt. 

Nous calculons le nombre de pièces détachées à partir des statistiques annuelles de réparations par équipement. Pour toutes les pièces de rechange, nous indiquons le solde minimum : quel minimum de pièces de rechange sont nécessaires dans chaque installation. Si les pièces détachées s'épuisent, leur quantité dans le répertoire est mise en évidence :

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenanceLe solde minimum de capteurs haute pression doit être d'au moins deux, mais il n'en reste qu'un. Il est temps de passer une commande maintenant. 

Dès l'arrivée d'un envoi de pièces détachées, nous remplissons le répertoire avec les données de la facture et indiquons le lieu de stockage. Nous voyons immédiatement le solde actuel de ces pièces détachées dans l'entrepôt : 
Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Nous maintenons un répertoire de contacts distinct. Nous y saisissons les données des fournisseurs et sous-traitants qui effectuent la maintenance : 

Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Les attestations et groupes d'habilitations de sécurité électrique sont joints à la fiche de chaque entrepreneur-ingénieur. Lors de l'élaboration d'un planning, nous pouvons voir quels spécialistes disposent de l'habilitation requise. 
Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Depuis l'existence du MMS, le travail avec les permis de chantier a changé. Par exemple, des documents contenant des instructions méthodologiques pour effectuer la maintenance ont été ajoutés. Si auparavant un ensemble d'opérations s'inscrivaient dans une petite liste de contrôle, alors des instructions détaillées couvrent tout : comment se préparer, quelles conditions sont nécessaires, etc.   

Il vous expliquera comment fonctionne maintenant l'ensemble du processus, à l'aide d'un exemple. alexdropp

Comment fonctionne la maintenance dans MMS ?

Autrefois, les travaux réalisés il y a longtemps étaient documentés après coup. Nous avons simplement effectué l'entretien et signé ensuite un certificat d'achèvement des travaux. 99% des serveurs le font, mais, par expérience, cela n'est pas suffisant. Pour ne rien oublier, on forme d'abord permis de travail. Il s'agit d'un document décrivant les travaux et les conditions de leur mise en œuvre. Tout entretien et réparation de notre système commence par cela. Comment cela peut-il arriver: 

  1. Nous regardons les prochains travaux prévus dans le planning de maintenance :
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  2. Nous créons un nouveau permis. Nous sélectionnons un entrepreneur de maintenance qui gère le processus de notre part et coordonne les travaux avec nous. Nous indiquons où et quand auront lieu les travaux, sélectionnons le type d'équipement et le programme que nous suivrons : 
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  3. Après avoir enregistré la carte, passez aux détails. Nous indiquons l'entrepreneur et vérifions s'il a l'autorisation d'effectuer les travaux requis. S'il n'y a pas d'autorisation, le champ est surligné en rouge et vous ne pouvez pas émettre d'ordre de travail :  
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  4. Nous indiquons des équipements spécifiques. Selon le type de travaux, des activités préliminaires sont prescrites dans le programme de maintenance, par exemple : commander du carburant sur le site, planifier un briefing d'accueil pour les ingénieurs et avertir les collègues. La liste des activités apparaîtra automatiquement, mais nous pouvons ajouter nos propres éléments. , tout est assez flexible :
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  5. Nous sauvegardons la commande, envoyons une lettre à la personne approuvant et attendons sa réponse :
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  6. Lorsque l'ingénieur arrive, nous imprimons le bon de travail directement à partir du système.
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  7. Le bon de travail contient une liste de contrôle des opérations pour le programme de maintenance. Le responsable des travaux du centre de données contrôle la maintenance et coche les cases.
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

    Pendant un certain temps, une courte liste de contrôle suffisait. Ensuite nous avons introduit des instructions méthodologiques, ou MOP (méthode opératoire). A l'aide d'un tel document, tout ingénieur certifié peut inspecter n'importe quel équipement. 

    Tout est décrit de la manière la plus détaillée possible, jusqu'aux modèles de lettres de notification et aux conditions météorologiques : 

    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

    Le document imprimé ressemble à ceci :

    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

    Selon les normes de l'Uptime Institute, il devrait y avoir un tel MOP pour toutes les opérations. Il s’agit d’une quantité assez importante de documentation. Par expérience, nous recommandons de les développer progressivement, par exemple une MOP par mois.

  8. Après les travaux, l’ingénieur délivre un certificat d’achèvement. Nous le numérisons et le joignons à la carte avec des scans d'autres documents : permis et MOP. 
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  9. Dans le bon de travail nous notons les travaux effectués : 
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance
  10. La fiche équipement contient l'historique de maintenance :
    Système MMS dans un data center : comment nous avons automatisé la gestion de la maintenance

Nous avons montré comment notre système fonctionne actuellement. Mais les travaux sur le MMS ne sont pas terminés : plusieurs améliorations sont déjà prévues. Par exemple, nous stockons désormais de nombreuses informations dans les analyses. À l'avenir, nous prévoyons de dématérialiser la maintenance : connectez une application mobile où l'ingénieur peut cocher les cases et enregistrer immédiatement les informations dans une carte. 

Bien entendu, il existe sur le marché de nombreux produits prêts à l’emploi dotés de fonctions similaires. Mais nous voulions montrer que même un petit fichier Excel peut être transformé en un produit à part entière. Vous pouvez le faire vous-même ou impliquer des entrepreneurs, l'essentiel est la bonne approche. Et il n'est jamais trop tard pour commencer.

Source: habr.com