Sistema MMS em um data center: como automatizamos a gestão da manutenção

Imagine que você tem uma sala de servidores completa com equipamentos de engenharia: várias dezenas de aparelhos de ar condicionado, vários grupos geradores a diesel e fontes de alimentação ininterruptas. Para que o hardware funcione como deveria, você verifica regularmente seu desempenho e não se esquece da manutenção preventiva: faça testes, verifique o nível do óleo, troque peças. Mesmo para uma sala de servidores, é necessário armazenar muitas informações: cadastro de equipamentos, lista de insumos no almoxarifado, cronograma de manutenção preventiva, além de documentos de garantia, contratos com fornecedores e empreiteiros. 

Agora vamos multiplicar o número de salas por dez. Surgiram questões de logística. Em que armazém você deve armazenar o que para não ter que correr atrás de cada peça de reposição? Como reabastecer os suprimentos em tempo hábil para que reparos não programados não o peguem de surpresa? Se houver muitos equipamentos, é impossível manter todo o trabalho técnico na cabeça e difícil no papel. É aqui que o MMS, ou sistema de gerenciamento de manutenção, vem em socorro. 

Sistema MMS em um data center: como automatizamos a gestão da manutenção
Na MMS elaboramos cronogramas de trabalhos preventivos e de reparo e armazenamos instruções para engenheiros. Nem todos os data centers possuem esse sistema; muitos consideram que é uma solução muito cara. Mas, pela nossa própria experiência, estamos convencidos de que Não é a ferramenta que importa, é a abordagem trabalhar com informações. Criamos o primeiro sistema em Excel e gradualmente o desenvolvemos em um produto de software. 

Com Alexdropp decidimos compartilhar nossa experiência no desenvolvimento de nosso próprio MMS. Mostrarei como o sistema se desenvolveu e como ajudou a introduzir as melhores práticas de manutenção. Alexey contará como herdou o MMS, o que mudou durante esse período e como o sistema agora facilita a vida dos engenheiros. 

Como chegamos ao nosso próprio MMS

Primeiro havia pastas. Há 8 a 10 anos, as informações eram armazenadas de forma dispersa. Após a manutenção, assinamos relatórios de trabalhos concluídos, armazenamos originais em papel em arquivos e digitalizamos cópias em pastas de rede. Da mesma forma, as informações sobre peças de reposição: peças de reposição, ferramentas e acessórios foram coletadas em pastas divididas por equipamento. É assim que você pode viver se construir uma estrutura e níveis de acesso para essas pastas.
Mas então você tem três problemas: 

  • navegação: leva muito tempo para alternar entre diferentes pastas. Se você quiser ver reparos em equipamentos específicos ao longo de vários anos, terá que fazer muitos cliques.
  • estatísticas: você não terá, e sem elas é difícil prever a rapidez com que vários equipamentos quebram ou quantas peças de reposição planejar para o próximo ano.  
  • resposta oportuna: ninguém irá lembrá-lo de que os componentes já estão acabando e precisam ser encomendados novamente. Também não é óbvio que esta não seja a primeira vez que o mesmo equipamento falha.  

Por um tempo armazenamos documentos assim, mas depois descobrimos o Excel :)

MMS para Excel. Com o tempo, a estrutura da documentação migrou para o Excel. Foi baseado em uma lista de equipamentos, com cronogramas de manutenção, checklists e links para certificados de conclusão de obra anexados: 

Sistema MMS em um data center: como automatizamos a gestão da manutenção

A lista de equipamentos indicava as principais características e localização no data center:
Sistema MMS em um data center: como automatizamos a gestão da manutenção

O resultado é uma espécie de navegador a partir do qual é possível entender rapidamente o que está acontecendo com o equipamento e sua manutenção. Se necessário, você pode consultar atos individuais do cronograma de manutenção usando os links:

Sistema MMS em um data center: como automatizamos a gestão da manutenção

Se você mantém um documento no Excel conscientemente, a solução é bastante adequada para uma pequena sala de servidores. Mas também é temporário. Mesmo que usemos um ar condicionado e façamos manutenção uma vez por mês, ao longo de cinco anos acumularemos centenas de erros e nosso Excel irá inchar. Se você adicionar outro ar condicionado, um gerador a diesel, um UPS, será necessário fazer várias folhas e conectá-las. Quanto mais longa a história, mais difícil será obter imediatamente as informações necessárias. 

O primeiro sistema "adulto". Em 2014, passamos pela primeira auditoria de Gestão & Operações segundo padrões de Sustentabilidade Operacional do Uptime Institute. Passamos quase pelo mesmo programa Excel, mas ao longo de um ano o aprimoramos bastante: adicionamos links para instruções e listas de verificação para engenheiros. Os auditores consideraram este formato bastante viável. Eles conseguiram acompanhar todas as operações com o equipamento e garantir que as informações estavam atualizadas e que os processos estavam em vigor. A auditoria então foi aprovada com estrondo, marcando 92 pontos em 100 possíveis.

Surgiu a questão: como viver mais. Decidimos que precisávamos de um MMS “sério”, analisamos vários programas pagos, mas no final decidimos escrever o software nós mesmos. O mesmo Excel foi utilizado como especificação técnica ampliada. Estas são as tarefas que definimos para o MMS. 

O que queríamos do MMS

Na maioria dos casos, o MMS é um conjunto de diretórios e relatórios. Nossa hierarquia de diretórios é mais ou menos assim:

Sistema MMS em um data center: como automatizamos a gestão da manutenção

O primeiro diretório de nível superior é lista de edifícios: salas de máquinas, armazéns onde estão localizados os equipamentos.

Sistema MMS em um data center: como automatizamos a gestão da manutenção

Em seguida vem lista de equipamentos de engenharia. Nós o coletamos de acordo com os seguintes sistemas:

  • Sistema de ar condicionado: condicionadores de ar, chillers, bombas.
  • Sistema de alimentação: UPS, grupos geradores a diesel, quadros de distribuição.

Sistema MMS em um data center: como automatizamos a gestão da manutenção
Para cada equipamento coletamos dados básicos: tipo, modelo, número de série, dados do fabricante, ano de fabricação, data de comissionamento, período de garantia.

Depois de preenchermos a lista de equipamentos, elaboramos para ela programa de manutenção: como e com que frequência fazer a manutenção. No programa de manutenção descrevemos conjunto de operações, por exemplo: substituir esta bateria, ajustar o funcionamento de uma peça específica e assim por diante. Descrevemos as operações em um livro de referência separado. Se uma operação for repetida em programas diferentes, não há necessidade de descrevê-la novamente a cada vez - simplesmente pegamos uma já pronta do livro de referência:

Sistema MMS em um data center: como automatizamos a gestão da manutenção
As operações “Alteração de setpoints de temperatura” e “Substituição de conexões de cabos de liberação rápida” serão comuns para chillers e sistemas de ar condicionado do mesmo fabricante.

Agora para cada equipamento podemos criar cronograma de manutenção. Vinculamos o programa de manutenção a equipamentos específicos, e o próprio sistema verifica no programa a frequência com que a manutenção precisa ser feita e calcula o tempo de trabalho a partir da data de comissionamento:
Sistema MMS em um data center: como automatizamos a gestão da manutençãoVocê pode até automatizar a preparação desse cronograma usando fórmulas do Excel.

História não totalmente óbvia: mantemos um diretório separado trabalho diferido. O horário é horário, mas somos todos pessoas vivas e entendemos que tudo pode acontecer. Por exemplo, um consumível não chegou a tempo e o serviço precisa de ser remarcado para uma semana. Esta é uma situação normal se você ficar de olho nela. Mantemos estatísticas sobre trabalhos diferidos e incompletos e tentamos garantir que os cancelamentos de manutenção tendam a zero.  

As estatísticas também são mantidas para cada equipamento acidentes e reparos não programados. Usamos estatísticas para planejar compras e encontrar pontos fracos na infraestrutura. Por exemplo, se um compressor queimar no mesmo local três vezes seguidas, é um sinal para procurar a causa da avaria.   

Sistema MMS em um data center: como automatizamos a gestão da manutenção
Este histórico de manutenção e reparos se acumulou ao longo de 4 anos para um ar condicionado específico.

O seguinte guia é Peças de reposição. Leva em consideração quais insumos são necessários para o equipamento, onde e em que quantidade estão armazenados. Aqui também armazenamos informações sobre prazos de entrega para melhor planejar as chegadas ao armazém. 

Calculamos o número de peças de reposição a partir das estatísticas anuais de reparos por equipamento. Para todas as peças de reposição indicamos o saldo mínimo: quais peças de reposição mínimas são necessárias em cada instalação. Caso as peças de reposição estejam acabando, sua quantidade no diretório é destacada:

Sistema MMS em um data center: como automatizamos a gestão da manutençãoO saldo mínimo dos sensores de alta pressão deve ser de pelo menos dois, mas resta apenas um. É hora de fazer um pedido agora. 

Assim que chega uma remessa de peças de reposição, preenchemos o diretório com os dados da fatura e indicamos o local de armazenamento. Vemos imediatamente o saldo atual dessas peças de reposição no armazém: 
Sistema MMS em um data center: como automatizamos a gestão da manutenção

Mantemos um diretório separado de contatos. Inserimos nele os dados de fornecedores e empreiteiros que realizam manutenção: 

Sistema MMS em um data center: como automatizamos a gestão da manutenção

Certificados e grupos de autorização de segurança elétrica estão anexados ao cartão de cada engenheiro-contratante. Ao traçar um cronograma, podemos ver quais especialistas possuem a habilitação necessária. 
Sistema MMS em um data center: como automatizamos a gestão da manutenção

Desde a existência do MMS, o trabalho com licenças de site mudou. Por exemplo, foram acrescentados documentos com instruções metodológicas para a realização de manutenções. Se anteriormente um conjunto de operações cabia em uma pequena lista de verificação, as instruções detalhadas cobrem tudo: como preparar, quais condições são necessárias e assim por diante.   

Ele contará como funciona todo o processo agora, usando um exemplo. Alexdropp

Como funciona a manutenção no MMS?

Era uma vez, um trabalho concluído há muito tempo era documentado após o fato. Simplesmente realizamos a manutenção e depois assinamos o certificado de conclusão da obra. 99% dos servidores fazem isso, mas, por experiência própria, isso não é suficiente. Para não esquecer de nada, primeiro formamos visto de trabalho. Este é um documento que descreve a obra e as condições para a sua execução. Qualquer manutenção e reparo em nosso sistema começa com ele. Como isso acontece: 

  1. Vemos as próximas obras previstas no cronograma de manutenção:
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  2. Criamos uma nova licença. Selecionamos um empreiteiro de manutenção que gerencia o processo de nossa parte e coordena o trabalho conosco. Indicamos onde e quando será realizada a obra, selecionamos o tipo de equipamento e o programa que iremos seguir: 
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  3. Depois de salvar o cartão, passe para os detalhes. Indicamos o empreiteiro e verificamos se ele tem autorização para realizar a obra necessária. Caso não haja permissão, o campo fica destacado em vermelho e não é possível emitir ordem de serviço:  
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  4. Indicamos equipamentos específicos. Dependendo do tipo de trabalho, atividades preliminares são prescritas no programa de manutenção, por exemplo: pedido de combustível para o local, agendamento de briefing de indução para engenheiros e notificação aos colegas. A lista de atividades aparecerá automaticamente, mas podemos adicionar nossos próprios itens , tudo é bastante flexível:
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  5. Salvamos o pedido, enviamos uma carta para quem aprova e aguardamos sua resposta:
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  6. Quando o engenheiro chega, imprimimos a ordem de serviço diretamente do sistema.
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  7. A ordem de serviço contém uma lista de verificação de operações para o programa de manutenção. O gerente de trabalho no data center controla a manutenção e marca as caixas.
    Sistema MMS em um data center: como automatizamos a gestão da manutenção

    Por um tempo, uma pequena lista de verificação foi suficiente. Em seguida, introduzimos instruções metodológicas, ou MOP (método de procedimento). Com a ajuda desse documento, qualquer engenheiro certificado pode inspecionar qualquer equipamento. 

    Tudo é descrito com o máximo de detalhes possível, até modelos de cartas de notificação e condições climáticas: 

    Sistema MMS em um data center: como automatizamos a gestão da manutenção

    O documento impresso fica assim:

    Sistema MMS em um data center: como automatizamos a gestão da manutenção

    De acordo com os padrões do Uptime Institute, deveria haver tal MOP para todas as operações. Esta é uma grande quantidade de documentação. Com base na experiência, recomendamos desenvolvê-los gradualmente, por exemplo, um MOP por mês.

  8. Após a obra, o engenheiro emite um certificado de conclusão. Digitalizamos e anexamos ao cartão junto com digitalizações de outros documentos: licença e MOP. 
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  9. Na ordem de serviço anotamos o trabalho executado: 
    Sistema MMS em um data center: como automatizamos a gestão da manutenção
  10. A ficha do equipamento contém o histórico de manutenção:
    Sistema MMS em um data center: como automatizamos a gestão da manutenção

Mostramos como nosso sistema funciona agora. Mas o trabalho no MMS ainda não acabou: já estão previstas diversas melhorias. Por exemplo, agora armazenamos muitas informações em varreduras. No futuro, pretendemos tornar a manutenção sem papel: conectar um aplicativo móvel onde o engenheiro possa marcar as caixas e salvar imediatamente as informações em um cartão. 

Claro, existem muitos produtos prontos no mercado com funções semelhantes. Mas queríamos mostrar que mesmo um pequeno arquivo Excel pode ser transformado em um produto completo. Você pode fazer isso sozinho ou envolver empreiteiros, o principal é a abordagem correta. E nunca é tarde para começar.

Fonte: habr.com