Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Imagine que tiene una sala de servidores llena de equipos de ingeniería: varias docenas de acondicionadores de aire, un montón de grupos electrógenos diésel y sistemas de alimentación ininterrumpida. Para que el hardware funcione como debería, comprobar periódicamente su rendimiento y no olvidarse del mantenimiento preventivo: realizar pruebas, comprobar el nivel de aceite, cambiar piezas. Incluso para una sala de servidores es necesario almacenar mucha información: un registro de equipos, una lista de consumibles en el almacén, un cronograma de mantenimiento preventivo, así como documentos de garantía, contratos con proveedores y contratistas. 

Ahora multipliquemos el número de pasillos por diez. Surgieron problemas de logística. ¿En qué almacén debería almacenar cada cosa para no tener que buscar cada pieza de repuesto? ¿Cómo reponer suministros oportunamente para que las reparaciones no programadas no te tomen por sorpresa? Si hay mucho equipo, es imposible mantener todo el trabajo técnico en la cabeza, y es difícil sobre el papel. Aquí es donde el MMS, o sistema de gestión de mantenimiento, viene al rescate. 

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
En MMS elaboramos cronogramas de trabajos preventivos y de reparación y almacenamos instrucciones para ingenieros. No todos los centros de datos tienen un sistema de este tipo; muchos lo consideran una solución demasiado cara. Pero por experiencia propia estamos convencidos de que No es la herramienta lo que importa, es el enfoque para trabajar con información. Creamos el primer sistema en Excel y gradualmente lo desarrollamos hasta convertirlo en un producto de software. 

Con alexdropp Decidimos compartir nuestra experiencia en el desarrollo de nuestro propio MMS. Mostraré cómo se desarrolló el sistema y cómo ayudó a introducir las mejores prácticas de mantenimiento. Alexey le contará cómo heredó MMS, qué ha cambiado durante este tiempo y cómo el sistema ahora facilita la vida a los ingenieros. 

Cómo llegamos a nuestro propio MMS

Primero fueron las carpetas.. Hace 8 o 10 años, la información se almacenaba de forma dispersa. Después del mantenimiento, firmamos informes de trabajo completado, almacenamos originales en papel en archivos y escaneamos copias en carpetas de red. De igual forma se recopiló información sobre repuestos: repuestos, herramientas y accesorios en carpetas desglosadas por equipo. Así es como puedes vivir si construyes una estructura y niveles de acceso para estas carpetas.
Pero entonces tienes tres problemas: 

  • Navegación: lleva mucho tiempo cambiar entre diferentes carpetas. Si desea ver reparaciones en equipos específicos durante varios años, tendrá que hacer muchos clics.
  • estadísticas: no las tendrás, y sin ellas es difícil predecir qué tan rápido se estropean varios equipos o cuántas piezas de repuesto planificar para el próximo año.  
  • respuesta oportuna: nadie le recordará que los componentes ya se están agotando y es necesario volver a pedirlos. Tampoco es obvio que no sea la primera vez que el mismo equipo falla.  

Durante un tiempo almacenamos documentos como este, pero luego descubrimos Excel :)

MMS a Excel. Con el tiempo, la estructura de la documentación migró a Excel. Se basó en una lista de equipos, con cronogramas de mantenimiento, listas de verificación y enlaces a certificados de finalización de trabajo adjuntos: 

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

La lista de equipos indicó las principales características y ubicación en el centro de datos:
Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

El resultado es una especie de navegador desde el que se puede entender rápidamente qué está pasando con el equipo y su mantenimiento. Si es necesario, puede consultar los actos individuales del programa de mantenimiento utilizando los enlaces:

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Si mantiene concienzudamente un documento en Excel, la solución es muy adecuada para una pequeña sala de servidores. Pero también es temporal. Incluso si usamos un aire acondicionado y le hacemos mantenimiento una vez al mes, en cinco años acumularemos cientos de errores y nuestro Excel se hinchará. Si agrega otro aire acondicionado, un generador diesel, un UPS, entonces necesitará hacer varias hojas y unirlas. Cuanto más larga sea la historia, más difícil será captar inmediatamente la información necesaria. 

El primer sistema "adulto". En 2014, nos sometimos a la primera auditoría de Gestión y Operaciones según los estándares de Sostenibilidad Operacional del Uptime Institute. Usamos casi el mismo programa de Excel, pero en el transcurso de un año lo mejoramos enormemente: agregamos enlaces a instrucciones y listas de verificación para ingenieros. Los auditores consideraron que este formato era bastante viable. Pudieron realizar un seguimiento de todas las operaciones con el equipo y se aseguraron de que la información estuviera actualizada y que los procesos estuvieran implementados. La auditoría fue aprobada con éxito y obtuvo 92 puntos sobre 100 posibles.

Surgió la pregunta: cómo vivir más. Decidimos que necesitábamos un MMS "serio", analizamos varios programas pagos, pero al final decidimos escribir el software nosotros mismos. Se utilizó el mismo Excel como especificación técnica ampliada. Estas son las tareas que configuramos para MMS. 

Lo que queríamos de MMS

En la mayoría de los casos, MMS es un conjunto de directorios e informes. Nuestra jerarquía de directorios se parece a esto:

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

El primer libro de referencia de alto nivel es lista de edificios: salas de máquinas, almacenes donde se ubican los equipos.

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Luego viene lista de equipos de ingeniería. Lo recopilamos según los siguientes sistemas:

  • Sistema de aire acondicionado: aires acondicionados, enfriadores, bombas.
  • Sistema de suministro de energía: UPS, grupos electrógenos diesel, cuadros de distribución.

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
Para cada equipo recopilamos datos básicos: tipo, modelo, número de serie, datos del fabricante, año de fabricación, fecha de puesta en servicio, período de garantía.

Cuando hayamos completado la lista de equipos, la elaboramos. programa de mantenimiento: cómo y con qué frecuencia realizar el mantenimiento. En el programa de mantenimiento describimos conjunto de operaciones, por ejemplo: reemplazar esta batería, ajustar el funcionamiento de una pieza específica, etc. Describimos las operaciones en un libro de referencia separado. Si una operación se repite en diferentes programas, entonces no es necesario describirla cada vez de nuevo; simplemente tomamos una ya preparada del libro de referencia:

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
Las operaciones “Cambio de consignas de temperatura” y “Reemplazo de conexiones de cables de liberación rápida” serán comunes para enfriadoras y sistemas de aire acondicionado del mismo fabricante.

Ahora para cada equipo podemos crear programa de mantenimiento. Vinculamos el programa de mantenimiento a equipos específicos y el propio sistema busca en el programa con qué frecuencia se debe realizar el mantenimiento y calcula el tiempo de trabajo desde la fecha de puesta en servicio:
Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimientoIncluso puedes automatizar la preparación de dicho cronograma utilizando fórmulas de Excel.

Historia no del todo obvia: mantenemos un directorio separado trabajo diferido. El horario es horario, pero todos somos personas vivas y entendemos que cualquier cosa puede pasar. Por ejemplo, un consumible no llegó a tiempo y es necesario reprogramar el servicio por una semana. Esta es una situación normal si la vigilas. Mantenemos estadísticas sobre el trabajo aplazado e incompleto y tratamos de garantizar que las cancelaciones de mantenimiento tiendan a cero.  

También se mantienen estadísticas para cada equipo. accidentes y reparaciones no programadas. Utilizamos estadísticas para planificar compras y encontrar puntos débiles en infraestructura. Por ejemplo, si un compresor se quema en el mismo lugar tres veces seguidas, esto es una señal para buscar la causa de la avería.   

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
Este historial de mantenimiento y reparaciones se ha acumulado durante 4 años para un aire acondicionado específico.

La siguiente guía es Repuestos. Tiene en cuenta qué consumibles se necesitan para el equipo, dónde y en qué cantidad se almacenan. Aquí también almacenamos información sobre los plazos de entrega para poder planificar mejor las llegadas al almacén. 

Calculamos el número de repuestos a partir de las estadísticas anuales de reparaciones por equipo. Para todos los repuestos indicamos el saldo mínimo: qué repuestos mínimos se necesitan en cada instalación. Si los repuestos se están agotando, se resalta su cantidad en el directorio:

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimientoEl equilibrio mínimo de sensores de alta presión debería ser al menos dos, pero solo queda uno. Es hora de hacer un pedido ahora. 

En cuanto llega un envío de repuestos, completamos el directorio con los datos de la factura e indicamos el lugar de almacenamiento. Inmediatamente vemos el saldo actual de dichos repuestos en el almacén: 
Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Mantenemos un directorio separado de contactos. Introducimos en el mismo los datos de los proveedores y contratistas que realizan el mantenimiento: 

Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Los certificados y grupos de autorización de seguridad eléctrica se adjuntan a la tarjeta de cada ingeniero contratista. Al elaborar un cronograma, podemos ver qué especialistas tienen la autorización requerida. 
Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Desde la existencia de MMS, el trabajo con permisos de sitio ha cambiado. Por ejemplo, se han agregado documentos con instrucciones metodológicas para realizar el mantenimiento. Si antes un conjunto de operaciones encajaba en una pequeña lista de verificación, entonces las instrucciones detalladas cubren todo: cómo prepararse, qué condiciones se necesitan, etc.   

Él le dirá cómo funciona todo el proceso ahora, usando un ejemplo. alexdropp

¿Cómo funciona el mantenimiento en MMS?

Érase una vez un trabajo realizado hace mucho tiempo que se documentaba a posteriori. Simplemente realizamos el mantenimiento y luego firmamos un certificado de finalización del trabajo. El 99% de los servidores hacen esto, pero, por experiencia, esto no es suficiente. Para no olvidarnos de nada, primero formamos permiso de trabajo. Este es un documento que describe el trabajo y las condiciones para su implementación. Cualquier mantenimiento y reparación en nuestro sistema comienza con él. Como sucedió esto: 

  1. Nos fijamos en los próximos trabajos previstos en el calendario de mantenimiento:
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  2. Creamos un nuevo permiso. Seleccionamos un contratista de mantenimiento que gestiona el proceso por nuestra parte y coordina el trabajo con nosotros. Indicamos dónde y cuándo se realizará el trabajo, seleccionamos el tipo de equipo y el programa que seguiremos: 
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  3. Después de guardar la tarjeta, pase a los detalles. Indicamos el contratista y comprobamos si tiene permiso para realizar el trabajo requerido. Si no hay permiso, el campo se resalta en rojo y no puede emitir una orden de trabajo:  
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  4. Indicamos equipamiento específico. Dependiendo del tipo de trabajo, en el programa de mantenimiento se prescriben actividades preliminares, por ejemplo: pedir combustible al sitio, programar una sesión informativa para ingenieros y notificar a los colegas. La lista de actividades aparecerá automáticamente, pero podemos agregar nuestras propias actividades. , todo es bastante flexible:
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  5. Guardamos el pedido, enviamos una carta a la persona que lo aprueba y esperamos su respuesta:
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  6. Cuando llega el ingeniero, imprimimos la orden de trabajo directamente desde el sistema.
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  7. La orden de trabajo contiene una lista de verificación de operaciones para el programa de mantenimiento. El jefe de trabajo en el centro de datos controla el mantenimiento y marca las casillas.
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

    Durante un tiempo, una breve lista de verificación fue suficiente. Luego introdujimos instrucciones metodológicas, o MOP (método de procedimiento). Con la ayuda de dicho documento, cualquier ingeniero certificado puede inspeccionar cualquier equipo. 

    Todo se describe con el mayor detalle posible, hasta plantillas para cartas de notificación y condiciones meteorológicas: 

    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

    El documento impreso se ve así:

    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

    Según los estándares del Uptime Institute, debería existir un MOP de este tipo para todas las operaciones. Se trata de una cantidad bastante grande de documentación. Según la experiencia, recomendamos desarrollarlos gradualmente, por ejemplo, un MOP por mes.

  8. Después del trabajo, el ingeniero emite un certificado de finalización. Lo escaneamos y lo adjuntamos a la tarjeta junto con escaneos de otros documentos: permiso y MOP. 
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  9. En la orden de trabajo anotamos el trabajo realizado: 
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento
  10. La tarjeta del equipo contiene el historial de mantenimiento:
    Sistema MMS en un centro de datos: cómo automatizamos la gestión del mantenimiento

Mostramos cómo funciona nuestro sistema ahora. Pero el trabajo sobre MMS no ha terminado: ya están previstas varias mejoras. Por ejemplo, ahora almacenamos mucha información en escaneos. En el futuro, planeamos hacer el mantenimiento sin papel: conectar una aplicación móvil donde el ingeniero pueda marcar las casillas y guardar inmediatamente la información en una tarjeta. 

Por supuesto, existen en el mercado muchos productos ya preparados con funciones similares. Pero queríamos demostrar que incluso un pequeño archivo de Excel puede convertirse en un producto completo. Puede hacerlo usted mismo o involucrar a contratistas, lo principal es el enfoque correcto. Y nunca es demasiado tarde para empezar.

Fuente: habr.com