Monitoramento no data center: como substituímos o antigo BMS por um novo. Parte 1

Monitoramento no data center: como substituímos o antigo BMS por um novo. Parte 1

O que é BMS

O sistema de monitoramento da operação de sistemas de engenharia em um data center é um elemento-chave da infraestrutura, afetando diretamente um indicador tão importante para um data center como a velocidade de resposta do pessoal a situações de emergência e, consequentemente, a duração da operação ininterrupta. 

Os sistemas de monitoramento BMS (Building Monitoring System) são oferecidos por muitos fornecedores globais de equipamentos para data centers. Durante o trabalho do Linxdatacenter na Rússia, tivemos a oportunidade de nos familiarizar com diferentes sistemas e encontrar abordagens diametralmente opostas de fornecedores para a operação desses sistemas. 

Contamos como atualizamos completamente nosso sistema BMS no ano passado e por quê.  

Raiz do problema

Tudo começou há 10 anos com o lançamento do data center Linxdatacenter em São Petersburgo. O sistema BMS, segundo os padrões da indústria da época, era um servidor físico com software instalado, acessado por meio de um programa cliente (o chamado cliente “thick”). 

Poucas empresas ofereciam essas soluções no mercado naquela época. Seus produtos eram o padrão, a única resposta a uma necessidade existente. E devemos dar-lhes o que lhes é devido: tanto naquela época como hoje, os líderes de mercado geralmente cumprem sua tarefa básica - fornecer soluções funcionais para a operação de data centers. 

A escolha lógica para nós foi a solução BMS de um dos maiores fabricantes do mundo. O sistema selecionado naquela época atendia a todos os requisitos para monitorar uma instalação de engenharia complexa, como um data center. 

No entanto, com o tempo, os requisitos e expectativas dos usuários (ou seja, nós, operadores de data center) em relação às soluções de TI mudaram. E os grandes fornecedores, como mostra uma análise de mercado das soluções propostas, não estavam preparados para isso.

O mercado corporativo de TI sofreu forte influência do setor B2C. As soluções digitais hoje devem fornecer uma experiência confortável para o usuário final - esse é o objetivo que os desenvolvedores estabeleceram para si próprios. Isso fica evidente nas melhorias nas interfaces de usuário (UI) e na experiência do usuário (UX) de muitos aplicativos corporativos. 

A pessoa se acostuma com o conforto de tudo relacionado às ferramentas digitais no dia a dia e impõe as mesmas exigências às ferramentas que utiliza nas tarefas de trabalho. As pessoas esperam das aplicações empresariais a mesma visibilidade, intuitividade, simplicidade e transparência que lhes estão disponíveis em serviços financeiros, chamadas de táxi ou compras online. Os especialistas em TI que implementam soluções em um ambiente corporativo também se esforçam para receber todas as “guloseimas” modernas: implantação e escalonamento simples, tolerância a falhas e possibilidades ilimitadas de personalização. 

Grandes fornecedores internacionais muitas vezes ignoram estas tendências. Confiando na sua autoridade de longa data na indústria, as empresas muitas vezes revelam-se categóricas e inflexíveis quando trabalham com os clientes. A ilusão da sua própria indispensabilidade não lhes permite ver como as jovens empresas tecnológicas aparecem literalmente debaixo dos seus narizes, oferecendo soluções alternativas à medida de um cliente específico, e sem pagar demasiado pela marca.

Desvantagens do antigo sistema BMS 

A principal desvantagem da solução BMS existente e desatualizada para nós era a sua operação lenta. A investigação de vários eventos em que o pessoal de serviço não respondia com rapidez suficiente levou-nos a compreender que por vezes havia um atraso significativo na apresentação dos eventos no BMS. Ao mesmo tempo, o sistema não estava sobrecarregado ou com defeito, apenas as versões de seus componentes (por exemplo, JAVA) estavam desatualizadas e não funcionavam corretamente com novas versões de sistemas operacionais sem atualizações. Eles só poderiam ser atualizados em conjunto com o sistema BMS, e o fornecedor não forneceu continuidade automática de versões, ou seja, para nós o processo seria quase tão trabalhoso quanto mudar para um novo sistema, e a nova solução manteve alguns dos as deficiências do antigo.  

Vamos adicionar mais algumas “coisinhas” desagradáveis ​​aqui:

  1. Pagamento pela conexão de novos dispositivos com base no princípio “um endereço IP – uma licença paga”; 
  2. Incapacidade de atualizar software sem adquirir um pacote de suporte (isso significa atualizar componentes gratuitos e eliminar erros no próprio programa BMS);
  3. Alto custo de suporte; 
  4. Расположение на «железном» сервере, который может выйти из строя и обладает лимитированными вычислительными ресурсами;
  5. “Redundância” instalando um segundo servidor de hardware com um pacote de licença duplicado. Ao mesmo tempo, não há sincronização de bancos de dados entre os servidores principal e de backup - o que significa transferência manual de banco de dados e um longo tempo de transição para o backup;
  6. Cliente de usuário “grosso”, inacessível externamente, sem extensão para dispositivo móvel e opção de acesso remoto;
  7. Interface web despojada, sem placas gráficas e notificações sonoras, acessível de fora, mas praticamente não utilizada pelos funcionários por falta de informação;
  8. Falta de animação na interface - todos os gráficos consistem apenas em uma imagem de “fundo” e ícones estáticos. O resultado é um baixo nível geral de visibilidade;

    Tudo parecia mais ou menos assim:

    Monitoramento no data center: como substituímos o antigo BMS por um novo. Parte 1

    Monitoramento no data center: como substituímos o antigo BMS por um novo. Parte 1

  9. Uma limitação na criação de sensores virtuais é que apenas a função de adição está disponível, enquanto modelos de sensores reais requerem a capacidade de realizar um conjunto de operações matemáticas para cálculos corretos que reflitam a realidade da operação; 
  10. Impossibilidade de obtenção de dados em tempo real ou do arquivo para qualquer finalidade (por exemplo, para visualização na conta pessoal do cliente);
  11. Total falta de flexibilidade e capacidade de alterar qualquer coisa no BMS para se adequar aos processos existentes do data center. 

Requisitos para um novo sistema BMS

Tendo em conta o acima exposto, os nossos principais requisitos foram os seguintes:

  1. Duas máquinas independentes e mutuamente redundantes com sincronização automática, rodando em duas plataformas de nuvem diferentes em data centers diferentes (no nosso caso, data centers Linxdatacenter São Petersburgo e Moscou);
  2. Adição gratuita de novos dispositivos;
  3. Atualizações gratuitas de software e seus componentes (exceto melhorias funcionais);
  4. Código-fonte aberto, permitindo-nos oferecer suporte independente ao sistema em caso de problemas por parte do desenvolvedor;
  5. A capacidade de receber e utilizar dados do BMS, por exemplo, num website ou na sua conta pessoal;
  6. Acesso via navegador WEB sem Thick Client;
  7. Usando contas de funcionários de domínio para acessar o BMS;
  8. Disponibilidade de animação e muitos outros pequenos e não tão pequenos desejos que se materializaram numa detalhada especificação técnica.

Última gota

Monitoramento no data center: como substituímos o antigo BMS por um novo. Parte 1

No momento em que percebemos que o data center tinha ultrapassado o seu BMS, a solução mais óbvia pareceu-nos atualizar o sistema existente. “Eles não trocam de cavalo no meio do caminho”, certo? 

No entanto, as grandes corporações, via de regra, não oferecem modificações personalizadas às suas soluções “polidas” de décadas de existência, vendidas em dezenas de países. Enquanto as jovens empresas testam uma ideia ou protótipo de um produto futuro em potenciais consumidores e contam com o feedback dos utilizadores para desenvolver o produto, as empresas continuam a vender licenças para um produto que já foi muito interessante, mas, infelizmente, hoje está desatualizado e inflexível.

E sentimos a diferença na abordagem de nós mesmos. Durante a correspondência com o fabricante do antigo BMS, rapidamente ficou claro que a atualização do sistema existente proposta pelo fornecedor resultaria na verdade na compra de um novo sistema para nós com transferência semiautomática de banco de dados, alto custo e armadilhas durante o transferência, que nem o próprio fabricante poderia prever. É claro que, neste caso, o custo do suporte técnico para a solução atualizada aumentou e permaneceu a necessidade de aquisição de licenças durante a expansão.

E o mais desagradável foi que o novo sistema não conseguiu satisfazer plenamente os nossos requisitos de reserva. O sistema BMS atualizado poderia ser implementado, como quiséssemos, numa plataforma cloud, o que nos permitiria abandonar o hardware, mas a opção de redundância não estava incluída no preço. Para fazer backup dos dados, teríamos que comprar um segundo servidor virtual BMS e um conjunto adicional de licenças. Com o custo de uma licença sendo de cerca de US$ 76 e o ​​número de endereços IP sendo de 1000 unidades, isso representa US$ 76 em despesas adicionais apenas para licenças da máquina de backup. 

A “cereja” da nova versão do BMS foi a necessidade de adquirir licenças adicionais “para todos os dispositivos” – até mesmo para o servidor principal. Aqui é necessário esclarecer que existem dispositivos conectados ao BMS através de gateways. O gateway possui um endereço IP, mas controla vários dispositivos (10 em média). No antigo BMS, isso exigia uma licença por endereço IP de gateway, as estatísticas eram mais ou menos assim: “1000 endereços/licenças IP, 1200 dispositivos”. O BMS atualizado funcionava com um princípio diferente e as estatísticas ficariam assim: “1000 endereços IP, 1200 dispositivos/licenças”. Ou seja, o fornecedor na nova versão mudou o princípio de atribuição de licenças e tivemos que comprar aproximadamente 200 licenças adicionais. 

O orçamento de “atualização” consistia, em última análise, em quatro pontos: 

  • custo da versão em nuvem e serviços de migração para ela; 
  • licenças adicionais ao pacote existente para dispositivos conectados via gateways;
  • custo da versão de backup em nuvem;  
  • um conjunto de licenças para a máquina de backup. 

O custo total do projeto foi de mais de US$ 100! E isso sem falar na necessidade de adquirir licenças para novos dispositivos no futuro.

Como resultado, percebemos que seria mais fácil para nós - e talvez até mais barato - encomendar um sistema criado de raiz, tendo em conta todas as nossas necessidades e prevendo a possibilidade de modernização no futuro. Mas ainda era preciso encontrar quem quisesse desenvolver um sistema tão complexo, comparar propostas, selecionar e com o finalista percorrer o caminho das especificações técnicas à implementação... Leia sobre isso na segunda parte do material em breve. 

Fonte: habr.com

Adicionar um comentário