Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos

¡Hola Habr! Soy Taras Chirkov, director del centro de datos Linxdatacenter en San Petersburgo. Y hoy en nuestro blog hablaré sobre el papel que juega el mantenimiento de la limpieza de las habitaciones en el funcionamiento normal de un centro de datos moderno, cómo medirlo, lograrlo y mantenerlo correctamente en el nivel requerido.

Pureza del gatillo

Un día, un cliente de un centro de datos en San Petersburgo se puso en contacto con nosotros acerca de una capa de polvo en la parte inferior de un bastidor de equipos. Este se convirtió en el punto de partida de la investigación, cuyas primeras hipótesis sugirieron lo siguiente:

  • El polvo ingresa a las salas de servidores desde las suelas de los zapatos de los empleados y clientes del centro de datos.
  • introducido a través del sistema de ventilación,
  • ambos.

Cubrezapatos azules: enviados al basurero de la historia

Empezamos con los zapatos. En aquella época el problema de la limpieza se solucionaba de la forma tradicional: un contenedor con cubrezapatos en la entrada. La efectividad del enfoque no alcanzó el nivel deseado: era difícil controlar su uso por parte de los visitantes del centro de datos y el formato en sí era inconveniente. Rápidamente fueron abandonados en favor de una tecnología más avanzada en forma de una máquina para cubrir zapatos. El primer modelo de un dispositivo de este tipo que instalamos fue un fracaso: la máquina rompía con demasiada frecuencia las fundas de los zapatos al intentar ponérselas, su uso resultaba más molesto que hacer la vida más fácil.

Recurrir a la experiencia de colegas de Varsovia y Moscú no resolvió el problema y al final se optó por la tecnología de fusión de películas térmicas en los zapatos. Con una película térmica, puede colocar “fundas para zapatos” en zapatos con cualquier suela, incluso con tacones finos de mujer. Sí, la película también se desliza a veces, pero con mucha menos frecuencia que las clásicas fundas azules para zapatos, y la tecnología en sí es mucho más cómoda para el visitante y más moderna. Otra ventaja importante (para mí) es que la película cubre fácilmente las tallas de zapatos más grandes, a diferencia de las fundas para zapatos tradicionales, que se rompen al intentar ponérselas en la talla 45. Para modernizar el proceso, instalaron contenedores con apertura automatizada de la tapa mediante un sensor de movimiento.

El proceso se ve así:  

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
Los invitados apreciaron inmediatamente la innovación.

Polvo en el viento

Habiendo ordenado el canal más evidente de posible contaminación espacial, nos ocupamos de cuestiones más sutiles: el aire. Es probable que una parte importante del polvo entre en las salas de servidores a través de la ventilación debido a una filtración insuficiente o que llegue desde la calle. ¿O se trata de la mala calidad de la limpieza? La investigación continuó.

Decidimos tomar medidas del contenido de partículas en el aire dentro del centro de datos e invitamos a un laboratorio especializado en monitorear la calidad del aire en salas blancas especiales para realizar este trabajo.

El personal del laboratorio midió la cantidad de puntos de control (20) y creó un programa de muestreo para rastrear la dinámica y crear la imagen más precisa. El coste del proceso completo de medición en el laboratorio fue de aproximadamente 1 millón de rublos, lo que nos pareció completamente impracticable, pero nos dio una serie de ideas para una implementación independiente. En el camino quedó claro que el laboratorio es bueno, pero los análisis deben realizarse de forma dinámica y recurrir constantemente a sus servicios es sumamente inconveniente.

Habiendo examinado las actividades planificadas del laboratorio, decidimos buscar dispositivos más utilitarios para el trabajo independiente. Como resultado, logramos encontrar la herramienta necesaria para esta tarea: un analizador de calidad del aire. Como esto:

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
El dispositivo muestra el contenido de partículas de diferentes diámetros (en micrómetros).

Redefiniendo estándares

Este dispositivo analiza el número de partículas, temperatura, humedad y muestra los resultados en unidades de medida según las normas ISO para este parámetro. La pantalla muestra los niveles de partículas de diferentes diámetros en la muestra de aire.

Al mismo tiempo, cometieron un error con los filtros: en aquel momento utilizaban modelos de filtro G4 dentro de las salas de servidores. Este modelo proporciona purificación del aire, por lo que se asumió la posibilidad de que faltaran partículas que condujeran a la contaminación. Decidimos comprar filtros finos F5 para realizar pruebas, que se utilizan en sistemas de aire acondicionado y ventilación como filtros de segunda etapa (postratamiento).

La investigación se ha llevado a cabo; puede comenzar con las medidas de control. Decidimos utilizar como guía los requisitos de la norma ISO 14644-1 para el número de partículas en suspensión.

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
Clasificación de salas blancas según el número de partículas en suspensión.

Parecería: medir y comparar según la tabla. Pero no todo es tan sencillo: en la práctica, resultó bastante difícil encontrar estándares de limpieza del aire para las salas de servidores de los centros de datos. Esto no se indica explícitamente en ninguna parte, ni en ninguna organización o instituto industrial. Y solo en el foro interno de Uptime Inside Track (el acceso a él está disponible para personas que hayan completado la capacitación en los programas de Uptime Institute) hubo una discusión separada sobre este tema. Según los resultados de su estudio, nos inclinamos a centrarnos en la norma ISO 8, la penúltima en la clasificación.

Las primeras mediciones mostraron que nos subestimamos: los resultados de las pruebas de aire interno mostraron el cumplimiento de los requisitos ISO 5 en las instalaciones internas, lo que superó significativamente los estándares deseados por los participantes de Uptime Inside Track. Al mismo tiempo, con un amplio margen. Tenemos un centro de datos, y no un laboratorio biológico, por supuesto, pero para que la concentración de partículas en el aire sea igual a ISO 8, debe ser un objeto al menos de la clase "planta de cemento". Y no está muy claro cómo se puede aplicar el mismo estándar a un centro de datos. Al mismo tiempo, obtuvimos el resultado en ISO 5 tomando medidas al filtrar el aire con filtros G4. Es decir, el polvo no puede entrar en las rejillas a través del aire, los filtros F5 resultaron superfluos y ni siquiera se utilizaron.

El resultado también es negativo: continuamos la búsqueda de la causa de la contaminación en otras direcciones y en las inspecciones trimestrales se incluyó el control de la calidad del aire, combinado con inspecciones de los sensores BMS mediante dispositivos verificados (requisitos ISO 9000 y auditorías de clientes).

A continuación se muestra un ejemplo de un informe que se completa en función de los datos obtenidos durante la medición. Para mayor precisión, las mediciones se realizan con dos dispositivos: Testo 610 y un sensor BMS. El encabezado de la tabla muestra los valores límite para los dispositivos. Las desviaciones en los parámetros especificados se resaltan automáticamente en color para facilitar la identificación de áreas o períodos problemáticos.
Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
Todo está claro para nosotros: la diferencia en los indicadores de los dispositivos es mínima y la concentración de partículas es mucho menor que el límite máximo.

Por la entrada trasera

Dado que había otras entradas a las salas blancas además de la entrada principal para clientes donde instalamos la máquina para cubrir zapatos, todavía era necesario evitar que la suciedad entrara al centro de datos a través de ellas.

Es inconveniente ponerse y quitarse las cubiertas de los zapatos durante los procedimientos de descarga del equipo, por lo que encontramos una máquina automática para limpiar las suelas. Conveniente, funcional, pero el factor humano lo influye en forma de un enfoque opcional para este dispositivo. Básicamente lo mismo que con los cubrezapatos de la entrada principal.

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos

Para solucionar el problema, empezaron a buscar opciones de limpieza que no se pudieran evitar: las alfombras pegajosas con capas desmontables lo solucionaban mejor. Durante el proceso de autorización en las puertas de entrada, el visitante deberá pararse sobre dicha alfombra, retirando el exceso de polvo de las suelas de sus zapatos.

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
Los limpiadores arrancan cada día la capa superior de una alfombra de este tipo; en total hay 60 capas, suficientes para unos 2 meses.

Después de visitar el centro de datos de Ericsson en Estocolmo, entre otras cosas, me di cuenta de cómo se resuelven allí estos problemas: además de las capas desprendibles, en Suecia se utilizan alfombras Dycem antibacterianas reutilizables. Me gustó la idea por el principio de reutilización y la capacidad de proporcionar una gran área de cobertura.

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
Alfombra mágica antibacteriana. Es una pena, no es un avión, pero podría haberlo sido, ¡a tal precio!

Fue difícil encontrar representantes de la empresa en Rusia y evaluar el coste de la solución para nuestro centro de datos. Como resultado, obtuvimos una cifra que era casi 100 veces más cara que la solución con alfombras multicapa: aproximadamente el mismo millón de rublos que en el proyecto con mediciones de pureza del aire. Además, quedó claro que era necesario utilizar productos de limpieza especiales, naturalmente disponibles sólo de este fabricante. La solución también desapareció por sí sola, nos decidimos por una opción multicapa.

Labor manual

Me gustaría especialmente llamar la atención sobre el hecho de que todas estas medidas no cancelaron el uso de mano de obra de limpieza. En preparación para la certificación del centro de datos Linxdatacenter según el estándar de gestión y operaciones del Uptime Institute, era necesario regular claramente las acciones de los empleados del servicio de limpieza en el territorio del centro de datos. Se redactaron instrucciones detalladas, prescribiendo dónde, qué y cómo debían hacer.

Un par de extractos de las instrucciones:

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos

Como puede ver, todo está prescrito, literalmente todos los aspectos del trabajo en una habitación específica, agentes de limpieza, materiales, etc., aceptables para su uso. No se deja ningún detalle sin atender, ni siquiera el más mínimo. Instrucción – firmada por cada empleado de servicio. En salas de servidores, cuartos eléctricos, etc. solo se eliminan en presencia de empleados autorizados del centro de datos, por ejemplo, el ingeniero de turno.

Pero eso no es todo

También se incluyen en la lista de medidas para garantizar la limpieza en el centro de datos: recorridos con inspección visual de las instalaciones, incluidas inspecciones semanales de los racks para detectar restos de cables en su interior, restos de embalajes de equipos y componentes. Para cada episodio de este tipo, se abre un incidente y el cliente recibe una notificación sobre la necesidad de eliminar las infracciones lo antes posible.

Además, hemos creado una sala separada para desempacar e instalar el equipo; esto también forma parte de la política de limpieza de la empresa.  

Otra medida que aprendimos de la práctica de Ericsson es mantener una presión de aire constante en las salas de servidores: la presión dentro de las salas es mayor que en el exterior, por lo que no hay corriente de aire; hablaremos de esta solución con más detalle en un artículo aparte.

Finalmente, nos hemos hecho con asistentes robóticos para los locales que están excluidos de la lista de lugares disponibles para la visita del personal de limpieza.

Seamos honestos sobre el centro de datos: cómo solucionamos el problema del polvo en las salas de servidores del centro de datos
La rejilla superior no sólo proporciona +10 a la protección del robot, sino que también evita que se atasque debajo de las bandejas de cables verticales de los racks.

Un hallazgo inesperado como conclusión.

La limpieza en el centro de datos es importante para el funcionamiento del servidor y del equipo de red que aspira aire a través de él. Superar los niveles de polvo permitidos provocará una acumulación de polvo en los componentes y un aumento total de la temperatura de hasta 1 grado Celsius. El polvo reduce la eficiencia de la refrigeración, lo que puede generar importantes costes indirectos al año y también afectar a la tolerancia a fallos de la instalación en su conjunto.

Esto puede ser una suposición especulativa, pero los expertos del Uptime Institute que certificaron el centro de datos Linxdatacenter según el estándar de calidad de Gestión y Operaciones prestan la máxima atención a la limpieza. Y fue aún más agradable recibir las valoraciones más halagadoras en este ámbito: nuestro centro de datos en San Petersburgo supera con creces los requisitos de certificación. Un experto del instituto nos llamó “el centro de datos más limpio que jamás haya visto”; además, Uptime utiliza nuestro centro de datos como ejemplo de cómo resolver el problema de las salas de servidores limpias. Además, superamos fácilmente cualquier auditoría de cliente sobre este parámetro: los requisitos más serios de los clientes más caprichosos se satisfacen sin medida.

Volvamos al principio de la historia. ¿De dónde vino la contaminación según la propia denuncia del inicio del artículo? La parte del rack del cliente que fue el motivo por el que se lanzó todo el proyecto de "limpieza en el centro de datos" estaba contaminada desde el momento en que el rack fue importado e instalado en el centro de datos. El cliente no había limpiado el rack cuando lo llevaron a la sala de servidores; al comprobar los racks vecinos instalados al mismo tiempo, resultó que la situación con el polvo era la misma allí. Esta situación motivó la adición de un elemento de control de limpieza a la lista de verificación de instalación del rack del cliente. Tampoco debemos olvidarnos nunca de la probabilidad de que ocurran tales cosas: el que está advertido, está prevenido. Se trata de "limpieza y dictadura" en nuestro centro de datos; en el próximo artículo hablaré sobre sensores de presión, pero por ahora, haga preguntas en los comentarios.

Fuente: habr.com

Añadir un comentario