Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center

Bonjour Habr! Je m'appelle Taras Chirkov, directeur du centre de données Linxdatacenter à Saint-Pétersbourg. Et aujourd'hui, dans notre blog, je parlerai du rôle que joue le maintien de la propreté des locaux dans le fonctionnement normal d'un centre de données moderne, comment le mesurer correctement, l'atteindre et le maintenir au niveau requis.

Déclencher la pureté

Un jour, un client d'un centre de données à Saint-Pétersbourg nous a contacté au sujet d'une couche de poussière au fond d'un rack d'équipement. Ce fut le point de départ d’une enquête dont les premières hypothèses suggéraient les suivantes :

  • la poussière pénètre dans les salles de serveurs depuis la semelle des chaussures des employés et des clients du data center,
  • amenés par le système de ventilation,
  • les deux.

Couvre-chaussures bleus - jetés dans la poubelle de l'histoire

Nous avons commencé avec des chaussures. A cette époque, le problème de la propreté était résolu de manière traditionnelle : un conteneur avec des couvre-chaussures à l'entrée. L'efficacité de l'approche n'a pas atteint le niveau souhaité : il était difficile de contrôler leur utilisation par les invités du centre de données et le format lui-même n'était pas pratique. Elles furent rapidement abandonnées au profit d’une technologie plus avancée sous la forme d’une machine à surchaussures. Le premier modèle d'un tel appareil que nous avons installé était un échec : la machine déchirait trop souvent les couvre-chaussures lorsqu'on essayait de les enfiler sur les chaussures, son utilisation était plus ennuyeuse que de rendre la vie plus facile.

Le recours à l'expérience de collègues de Varsovie et de Moscou n'a pas résolu le problème et le choix s'est finalement porté en faveur de la technologie de fusion d'un film thermique sur les chaussures. Grâce au film thermique, vous pouvez mettre des « couvre-chaussures » sur des chaussures avec n’importe quelle semelle, même un talon fin pour femme. Oui, le film glisse aussi parfois, mais beaucoup moins souvent que les couvre-chaussures bleus classiques, et la technologie elle-même est beaucoup plus pratique pour le visiteur et plus moderne. Un autre avantage important (pour moi) est que le film couvre facilement les plus grandes pointures, contrairement aux couvre-chaussures traditionnels, qui se déchirent lorsqu'on essaie de les enfiler sur une pointure 45. Pour rendre le processus plus moderne, ils ont installé des poubelles avec ouverture automatique du couvercle à l'aide d'un détecteur de mouvement.

Le processus ressemble à ceci :  

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
Les invités ont immédiatement apprécié l'innovation.

Poussière dans le vent

Après avoir mis de l'ordre dans le canal le plus évident de pollution spatiale possible, nous avons abordé des sujets plus subtils : l'air. Il est probable qu'une partie importante de la poussière pénètre dans les salles de serveurs par la ventilation en raison d'une filtration insuffisante ou soit apportée depuis la rue. Ou est-ce dû à la mauvaise qualité du nettoyage ? L'enquête s'est poursuivie.

Nous avons décidé de mesurer la teneur en particules de l'air à l'intérieur du data center et avons invité un laboratoire spécialisé dans le contrôle de la qualité de l'air dans les salles blanches dédiées à réaliser ces travaux.

Le personnel du laboratoire a mesuré le nombre de points de contrôle (20) et a créé un programme d'échantillonnage pour suivre la dynamique et créer l'image la plus précise possible. Le coût du processus complet de mesure en laboratoire était d'environ 1 million de roubles, ce qui nous semblait totalement irréaliste, mais cela nous a donné un certain nombre d'idées pour une mise en œuvre indépendante. En cours de route, il est devenu évident que le laboratoire est bon, mais que les analyses doivent être effectuées de manière dynamique et que le recours constant à leurs services est extrêmement gênant.

Après avoir examiné les activités prévues du laboratoire, nous avons décidé de nous intéresser à des dispositifs plus utilitaires pour le travail indépendant. En conséquence, nous avons réussi à trouver l'outil nécessaire à cette tâche : un analyseur de la qualité de l'air. Comme ça:

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
L'appareil affiche la teneur en particules de différents diamètres (en micromètres).

Redéfinir les normes

Cet appareil analyse le nombre de particules, la température, l'humidité et affiche les résultats en unités de mesure selon les normes ISO pour ce paramètre. L'écran affiche les niveaux de particules de différents diamètres dans l'échantillon d'air.

En même temps, ils ont commis une erreur avec les filtres : à cette époque, ils utilisaient des modèles de filtres G4 à l’intérieur des salles de serveurs. Ce modèle fournit une purification grossière de l'air, de sorte que la possibilité de manquer de particules conduisant à une pollution a été supposée. Nous avons décidé d'acheter des filtres fins F5 pour les tests, qui sont utilisés dans les systèmes de climatisation et de ventilation comme filtres de deuxième étage (post-traitement).

L'enquête est terminée - vous pouvez commencer les mesures de contrôle. Nous avons décidé de nous baser sur les exigences de la norme ISO 14644-1 concernant le nombre de particules en suspension.

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
Classification des salles blanches selon le nombre de particules en suspension.

Il semblerait - mesurez et comparez selon le tableau. Mais tout n'est pas si simple : dans la pratique, il s'est avéré assez difficile de trouver des normes de pureté de l'air pour les salles de serveurs des centres de données. Cela n’est explicitement indiqué nulle part, par aucune organisation ou institut industriel. Et ce n'est que sur le forum interne Uptime Inside Track (l'accès est disponible aux personnes ayant suivi une formation dans les programmes Uptime Institute) qu'il y a eu une discussion distincte sur ce sujet. Sur la base des résultats de son étude, nous avons été enclins à nous concentrer sur la norme ISO 8, l'avant-dernière de la classification.

Les toutes premières mesures ont montré que nous nous sommes sous-estimés - les résultats des tests d'air intérieur ont montré le respect des exigences ISO 5 dans les locaux internes, ce qui dépassait largement les normes souhaitées par les participants d'Uptime Inside Track. En même temps, avec une grande marge. Nous avons un data center, et non un laboratoire de biologie bien sûr, mais pour que la concentration de particules dans l'air soit égale à ISO 8, il faut qu'il s'agisse d'un objet au moins de classe « cimenterie ». Et la manière dont la même norme peut être appliquée à un centre de données n’est pas très claire. Parallèlement, nous avons obtenu le résultat à ISO 5 en prenant des mesures lors de la filtration de l'air avec des filtres G4. Autrement dit, la poussière ne peut pas pénétrer dans les racks par l'air ; les filtres F5 se sont avérés redondants et n'ont même pas été utilisés.

Un résultat négatif est aussi un résultat : nous avons poursuivi la recherche de la cause de la pollution dans d'autres directions, et la surveillance de la qualité de l'air a été incluse dans des inspections trimestrielles, combinées à des inspections des capteurs BMS par des appareils vérifiés (exigences ISO 9000 et audits clients).

Vous trouverez ci-dessous un exemple de rapport rempli sur la base des données obtenues lors de la mesure. Pour une plus grande précision, les mesures sont effectuées avec deux appareils - le Testo 610 et un capteur BMS. L'en-tête du tableau indique les valeurs limites des appareils. Les écarts dans les paramètres spécifiés sont automatiquement mis en évidence en couleur pour faciliter l'identification des zones ou des périodes problématiques.
Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
Tout est clair chez nous : la différence entre les indicateurs des appareils est minime et la concentration de particules est bien inférieure à la limite maximale.

Par l'entrée arrière

Comme il y avait d'autres entrées dans les salles blanches que l'entrée principale des clients où nous avons installé la machine à couvre-chaussures, il était toujours nécessaire d'empêcher la saleté de pénétrer dans le centre de données par celles-ci.

Il n'est pas pratique de mettre/retirer des couvre-chaussures pendant les procédures de déchargement du matériel, c'est pourquoi nous avons trouvé une machine automatique pour nettoyer les semelles. Pratique, fonctionnel, mais le facteur humain l'affecte sous la forme d'une approche facultative de cet appareil. Essentiellement la même chose que pour les couvre-chaussures à l'entrée principale.

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center

Pour résoudre le problème, ils ont commencé à rechercher des options de nettoyage incontournables : les tapis collants à couches détachables s'en chargeaient le mieux. Lors du processus d'autorisation aux portes d'entrée, le visiteur doit se tenir debout sur un tel tapis, enlevant l'excès de poussière des semelles de ses chaussures.

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
Les nettoyeurs arrachent chaque jour la couche supérieure d'un tel tapis : il y a 60 couches au total, soit suffisamment pour environ 2 mois.

Après avoir visité, entre autres, le centre de données Ericsson à Stockholm, j'ai remarqué comment ces problèmes y sont résolus : en plus des couches détachables, des tapis Dycem antibactériens réutilisables sont utilisés en Suède. J'ai aimé l'idée en raison du principe de réutilisabilité et de la possibilité de fournir une large zone de couverture.

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
Tapis antibactérien magique. C’est dommage, ce n’est pas un avion, mais ça aurait pu l’être – à tel prix !

C'est avec difficulté que nous avons trouvé des représentants de l'entreprise en Russie et évalué le coût de la solution pour notre centre de données. En conséquence, nous avons obtenu un chiffre presque 100 fois plus cher que la solution avec des tapis multicouches - environ le même million de roubles que dans le projet avec mesures de pureté de l'air. De plus, il est devenu évident qu'il était nécessaire d'utiliser des produits de nettoyage spéciaux, naturellement disponibles uniquement auprès de ce fabricant. La solution a également disparu d'elle-même ; nous avons opté pour une option multicouche.

Travail manuel

Je voudrais surtout attirer l’attention sur le fait que toutes ces mesures n’ont pas supprimé le recours à la main-d’œuvre des nettoyeurs. En préparation de la certification du centre de données Linxdatacenter selon la norme Uptime Institute Management & Operations, il était nécessaire de réglementer clairement les actions des employés du service de nettoyage sur le territoire du centre de données. Des instructions détaillées ont été rédigées, précisant où, quoi et comment ils devaient faire.

Quelques extraits des instructions :

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center

Comme vous pouvez le constater, tout est prescrit, littéralement tous les aspects du travail dans une pièce spécifique, les produits de nettoyage, les matériaux, etc., acceptables à utiliser. Aucun détail n’est laissé de côté, même le plus petit. Instruction – signée par chaque employé du service. Dans les salles de serveurs, les salles électriques, etc. ils ne sont supprimés qu'en présence d'employés autorisés du centre de données, par exemple l'ingénieur de service.

Mais ce n'est pas tout

Sont également inclus dans la liste des mesures visant à garantir la propreté du data center : des visites avec inspection visuelle des locaux, y compris des inspections hebdomadaires des racks pour détecter les chutes de fils laissées à l'intérieur, les restes d'emballages d'équipements et de composants. Pour chacun de ces épisodes, un incident est ouvert et le client reçoit une notification sur la nécessité d'éliminer les violations dans les plus brefs délais.

Nous avons également créé une salle séparée pour le déballage et l’installation du matériel – cela fait également partie de la politique de nettoyage de l’entreprise.  

Une autre mesure que nous avons apprise de la pratique d'Ericsson consiste à maintenir une pression d'air constante dans les salles de serveurs : la pression à l'intérieur des salles est plus élevée qu'à l'extérieur, de sorte qu'il n'y a pas de courant d'air vers l'intérieur - nous parlerons de cette solution plus en détail dans un article séparé.

Enfin, nous nous sommes dotés d'assistants robotisés pour les locaux exclus de la liste de ceux accessibles à la visite du personnel de nettoyage.

Soyons honnêtes à propos du data center : comment nous avons résolu le problème de la poussière dans les salles de serveurs du data center
La grille du dessus donne non seulement +10 à la protection du robot, mais évite également qu'il ne se coince sous les chemins de câbles verticaux des racks.

Une découverte inattendue en guise de conclusion

La propreté du centre de données est importante pour le fonctionnement des serveurs et des équipements réseau qui y aspirent l'air. Le dépassement des niveaux de poussière autorisés entraînera une accumulation de poussière sur les composants et une augmentation totale de la température pouvant atteindre 1 degré Celsius. La poussière réduit l'efficacité du refroidissement, ce qui peut entraîner des coûts indirects importants par an et affecter également la tolérance aux pannes de l'installation dans son ensemble.

Il s'agit peut-être d'une hypothèse spéculative, mais les experts de l'Uptime Institute qui ont certifié le centre de données Linxdatacenter selon la norme de qualité Management & Operations accordent la plus grande attention à la propreté. Et c'était encore plus agréable de recevoir les évaluations les plus flatteuses dans ce domaine : notre centre de données à Saint-Pétersbourg dépasse largement les exigences de certification. Un expert de l'institut nous a qualifié de « centre de données le plus propre qu'il ait vu ». De plus, notre centre de données est utilisé par Uptime comme exemple de la manière de résoudre le problème des salles de serveurs propres. De plus, nous réussissons facilement n'importe quel audit client sur ce paramètre - les exigences les plus sérieuses des clients les plus capricieux sont satisfaites au-delà de toute mesure.

Revenons au début de l'histoire. D’où vient la contamination selon la plainte même du début de l’article ? La partie du rack du client qui a motivé le lancement de l'ensemble du projet "clean in the data center" a été contaminée dès l'importation et l'installation du rack dans le data center. Le client n'a pas nettoyé le rack au moment où il a été amené dans la salle des serveurs - lors de la vérification des racks voisins installés en même temps, il s'est avéré que la situation avec la poussière y était la même. Cette situation a conduit à l'ajout d'un élément de contrôle de nettoyage à la liste de contrôle d'installation en rack du client. Nous ne devrions jamais non plus oublier la probabilité que de telles choses se produisent : qui est prévenu est prévenu. Il s’agit ici de « propreté et dictature » ​​dans notre centre de données ; dans le prochain article, je parlerai des capteurs de pression, mais pour l’instant, posez des questions dans les commentaires.

Source: habr.com

Ajouter un commentaire