Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades

Hola, Habr! Sóc Taras Chirkov, director del centre de dades Linxdatacenter a Sant Petersburg. I avui al nostre blog parlaré de quin paper juga el manteniment de la neteja de l'habitació en el funcionament normal d'un centre de dades modern, com mesurar-lo correctament, aconseguir-ho i mantenir-lo al nivell requerit.

Activar la puresa

Un dia, un client d'un centre de dades de Sant Petersburg es va posar en contacte amb nosaltres sobre una capa de pols a la part inferior d'un bastidor d'equips. Aquest va ser el punt de partida de la investigació, les primeres hipòtesis de la qual suggerien el següent:

  • la pols entra a les sales de servidors des de la sola de les sabates dels empleats i clients del centre de dades,
  • introduït a través del sistema de ventilació,
  • tots dos.

Fundas de sabates blaves: enviades a la paperera de la història

Vam començar amb sabates. Aleshores, el problema de la neteja es resolia de la manera tradicional: un contenidor amb sabates a l'entrada. L'eficàcia de l'enfocament no va assolir el nivell desitjat: era difícil controlar-ne l'ús per part dels hostes del centre de dades i el format en si era inconvenient. Van ser abandonats ràpidament a favor d'una tecnologia més avançada en forma de màquina de coberta de sabates. El primer model d'un dispositiu d'aquest tipus que vam instal·lar va ser un fracàs: la màquina es trencava amb massa freqüència les cobertes de sabates quan intentava posar-les a les sabates, el seu ús era més molest que fer la vida més fàcil.

Recórrer a l'experiència dels col·legues de Varsòvia i Moscou no va resoldre el problema i, al final, es va optar per la tecnologia de fusió de pel·lícula tèrmica a les sabates. Amb pel·lícula tèrmica, podeu posar "cobertes de sabates" a les sabates amb qualsevol sola, fins i tot un taló prim de dona. Sí, la pel·lícula també es rellisca de vegades, però molt menys sovint que les clàssiques cobertes de sabates blaves, i la tecnologia en si és molt més convenient per al visitant i més moderna. Un altre avantatge important (per a mi) és que la pel·lícula cobreix fàcilment les mides de sabates més grans, a diferència de les cobertes de sabates tradicionals, que es trenquen quan s'intenta posar-les a la talla 45. Per modernitzar el procés, van instal·lar papereres amb obertura automàtica de la tapa mitjançant un sensor de moviment.

El procés té aquest aspecte:  

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
Els convidats van apreciar immediatament la innovació.

Pols al vent

Després d'haver ordenat el canal més evident de la possible contaminació espacial, ens vam ocupar d'assumptes més subtils: l'aire. És probable que una part important de la pols entri a les sales de servidors a través de la ventilació a causa d'una filtració insuficient o que s'introdueixi des del carrer. O es tracta de la mala qualitat de la neteja? La investigació va continuar.

Vam decidir prendre mesures del contingut de partícules a l'aire dins del centre de dades i vam convidar un laboratori especialitzat en el control de la qualitat de l'aire en sales netes especials per dur a terme aquest treball.

El personal del laboratori va mesurar el nombre de punts de control (20) i va crear un calendari de mostreig per fer un seguiment de la dinàmica i crear la imatge més precisa. El cost del procés de mesurament complet del laboratori va ser d'un milió de rubles, cosa que ens va semblar completament poc pràctic, però ens va donar una sèrie d'idees per a una implementació independent. Al llarg del camí, va quedar clar que el laboratori és bo, però les anàlisis s'han de fer de forma dinàmica i recórrer constantment als seus serveis és extremadament inconvenient.

Després d'haver mirat les activitats planificades del laboratori, vam decidir mirar dispositius més utilitaris per al treball independent. Com a resultat, vam aconseguir trobar l'eina necessària per a aquesta tasca: un analitzador de qualitat de l'aire. Com això:

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
El dispositiu mostra el contingut de partícules de diferents diàmetres (en micròmetres).

Redefinició dels estàndards

Aquest dispositiu analitza el nombre de partícules, la temperatura, la humitat i mostra els resultats en unitats de mesura segons les normes ISO per a aquest paràmetre. La pantalla mostra els nivells de partícules amb diferents diàmetres a la mostra d'aire.

Al mateix temps, van cometre un error amb els filtres: en aquell moment, utilitzaven models de filtres G4 a les sales de servidors. Aquest model proporciona una purificació de l'aire bruta, de manera que es va suposar la possibilitat que falten partícules que condueixin a la contaminació. Vam decidir comprar filtres fins F5 per a proves, que s'utilitzen en sistemes d'aire condicionat i ventilació com a filtres de segona etapa (posttractament).

La investigació s'ha dut a terme: podeu començar les mesures de control. Vam decidir utilitzar com a guia els requisits de la norma ISO 14644-1 per al nombre de partícules en suspensió.

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
Classificació de les sales blanques segons el nombre de partícules en suspensió.

Sembla: mesurar i comparar segons la taula. Però no tot és tan senzill: a la pràctica, va resultar bastant difícil trobar estàndards de neteja de l'aire per a les sales de servidors del centre de dades. Això no s'indica explícitament enlloc, per cap organització o institut de la indústria. I només al fòrum intern d'Uptime Inside Track (l'accés està disponible per a persones que han completat la formació en els programes de l'Uptime Institute) hi va haver una discussió separada sobre aquest tema. A partir dels resultats del seu estudi, ens vam inclinar a centrar-nos en la norma ISO 8, la penúltima de la classificació.

Les primeres mesures van demostrar que ens vam subestimar a nosaltres mateixos: els resultats de les proves d'aire intern van mostrar el compliment dels requisits ISO 5 a les instal·lacions internes, que van superar significativament els estàndards desitjats pels participants de Uptime Inside Track. Al mateix temps, amb un gran marge. Tenim un centre de dades, i no un laboratori biològic, és clar, però perquè la concentració de partícules a l'aire sigui igual a la ISO 8, ha de ser un objecte com a mínim de la classe "cimentera". I com es pot aplicar el mateix estàndard a un centre de dades no està molt clar. Al mateix temps, hem obtingut el resultat a ISO 5 fent mesures en filtrar l'aire amb filtres G4. És a dir, la pols no pot entrar als bastidors per l'aire; els filtres F5 van resultar ser redundants i ni tan sols es van utilitzar.

Un resultat negatiu també n'és un resultat: hem continuat la recerca de la causa de la contaminació en altres direccions, i el control de la qualitat de l'aire s'ha inclòs en les inspeccions trimestrals, combinada amb les inspeccions de sensors BMS per dispositius verificats (requisits ISO 9000 i auditories de clients).

A continuació es mostra un exemple d'informe que s'omple a partir de les dades obtingudes durant el mesurament. Per a una major precisió, les mesures es fan amb dos dispositius: Testo 610 i un sensor BMS. La capçalera de la taula mostra els valors límit per als dispositius. Les desviacions dels paràmetres especificats es ressalten automàticament en color per facilitar la identificació de les àrees problemàtiques o períodes de temps.
Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
Tot està clar amb nosaltres: la diferència en els indicadors dels dispositius és mínima i la concentració de partícules és molt inferior al límit màxim.

Per l'entrada posterior

Com que hi havia altres accessos a les sales netes a més de l'entrada principal del client on instal·làvem la màquina de cobrir sabates, encara era necessari evitar que la brutícia entrés al centre de dades a través d'elles.

És incòmode posar/treure les cobertes de sabates durant els procediments de descàrrega d'equips, així que hem trobat una màquina automàtica per netejar les soles. Convenient, funcional, però el factor humà l'afecta en forma d'aproximació opcional a aquest dispositiu. Essencialment el mateix que amb les cobertes de sabates a l'entrada principal.

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades

Per solucionar el problema, van començar a buscar opcions de neteja que no es podien evitar: les catifes enganxoses amb capes desmuntables ho tractaven millor. Durant el procés d'autorització a les portes d'entrada, el visitant s'haurà de posar sobre una estora d'aquest tipus, eliminant l'excés de pols de les soles de les sabates.

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
Els netejadors treuen la capa superior d'aquesta catifa cada dia; hi ha 60 capes en total, suficients per uns 2 mesos.

Després d'haver visitat el centre de dades d'Ericsson a Estocolm, entre altres coses, em vaig adonar de com es resolen aquests problemes allà: juntament amb les capes d'esquinçament, a Suècia s'utilitzen catifes antibacterianes reutilitzables Dycem. M'ha agradat la idea pel principi de reutilització i la capacitat de proporcionar una gran àrea de cobertura.

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
Catifa màgica antibacteriana. És una llàstima, no un avió, però podria haver estat, a tal i tal preu!

Va ser amb dificultat que vam trobar representants de l'empresa a Rússia i vam avaluar el cost de la solució per al nostre centre de dades. Com a resultat, vam obtenir una xifra gairebé 100 vegades més cara que la solució amb catifes multicapa, aproximadament el mateix milió de rubles que en el projecte amb mesures de puresa de l'aire. A més, va quedar clar que era necessari utilitzar productes de neteja especials, naturalment disponibles només d'aquest fabricant. La solució també va desaparèixer per si sola; vam optar per una opció multicapa.

Treball manual

M'agradaria especialment cridar l'atenció sobre el fet que totes aquestes mesures no van cancel·lar l'ús de mà d'obra de neteja. En preparació per a la certificació del centre de dades Linxdatacenter segons l'estàndard de gestió i operacions de l'Institut Uptime, era necessari regular clarament les accions dels empleats del servei de neteja al territori del centre de dades. Es van elaborar instruccions detallades, en què s'indicaven on, què i com havien de fer.

Un parell d'extractes de les instruccions:

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades

Com podeu veure, tot està prescrit, literalment tots els aspectes del treball en una habitació concreta, productes de neteja, materials, etc. acceptables per al seu ús. No es deixa un sol detall desatès, ni tan sols el més petit. Instrucció: signada per cada empleat del servei. En sales de servidors, sales elèctriques, etc. només s'eliminen en presència d'empleats autoritzats del centre de dades, per exemple, l'enginyer de servei.

Però això no és tot

També s'inclouen a la llista de mesures per garantir la neteja al centre de dades: passejades amb inspecció visual de les instal·lacions, incloent inspeccions setmanals de bastidors per detectar restes de filferro que queden al seu interior, restes d'envasos d'equips i components. Per a cada episodi, s'obre un incident i el client rep una notificació sobre la necessitat d'eliminar les infraccions tan aviat com sigui possible.

A més, hem creat una sala separada per desembalar i instal·lar l'equip; això també forma part de la política de neteja de l'empresa.  

Una altra mesura que hem après de la pràctica d'Ericsson és mantenir la pressió de l'aire constant a les sales de servidors: la pressió a l'interior de les habitacions és més gran que a l'exterior, de manera que no hi ha cap corrent d'aire; parlarem d'aquesta solució amb més detall en un article separat.

Finalment, ens hem aconseguit assistents robòtics per a locals que queden exclosos de la llista dels disponibles per a la visita del personal de neteja.

Siguem sincers sobre el centre de dades: com hem resolt el problema de la pols a les sales de servidors del centre de dades
La reixa a la part superior no només dóna +10 a la protecció del robot, sinó que també evita que s'enganxi sota les safates de cables verticals dels bastidors.

Una troballa inesperada com a conclusió

La neteja al centre de dades és important per al funcionament del servidor i dels equips de xarxa que hi atrauen aire. Superar els nivells de pols permesos provocarà una acumulació de pols als components i un augment total de la temperatura de fins a 1 grau centígrad. La pols redueix l'eficiència de refrigeració, la qual cosa pot provocar costos indirectes importants per any i també afectar la tolerància a errors de la instal·lació en el seu conjunt.

Aquesta pot ser una suposició especulativa, però els experts de l'Uptime Institute que van certificar el centre de dades Linxdatacenter amb l'estàndard de qualitat de gestió i operacions presten la màxima atenció a la neteja. I encara va ser més agradable rebre les avaluacions més afavoridores en aquesta àrea: el nostre centre de dades a Sant Petersburg supera seriosament els requisits de certificació. Un expert de l'institut ens va anomenar "el centre de dades més net que ha vist", a més, Uptime utilitza el nostre centre de dades com a exemple de com resoldre el problema de les sales de servidors netes. A més, passem fàcilment qualsevol auditoria de client sobre aquest paràmetre: els requisits més seriosos dels clients més capritxosos es compleixen sense mesura.

Tornem al principi de la història. D'on ha sortit la contaminació segons la mateixa queixa del principi de l'article? La part del bastidor del client que va ser el motiu pel qual es va posar en marxa tot el projecte de "neteja al centre de dades" es va contaminar des del moment en què es va importar el bastidor i es va instal·lar al centre de dades. El client no va netejar el bastidor quan es va introduir a la sala de servidors; en comprovar simultàniament els bastidors veïns instal·lats, va resultar que la situació amb la pols era la mateixa allà. Aquesta situació va provocar l'addició d'un element de control de neteja a la llista de verificació d'instal·lació del bastidor del client. Tampoc no hem d'oblidar-nos mai de la probabilitat d'aquestes coses = avisat és previ. Es tracta de "neteja i dictadura" al nostre centre de dades; en el proper article parlaré dels sensors de pressió, però de moment, feu preguntes als comentaris.

Font: www.habr.com

Afegeix comentari