Como construímos um sistema de alimentação de backup no data center de Tushino: engenharia e finanças

Como construímos um sistema de alimentação de backup no data center de Tushino: engenharia e finanças

O data center Tushino é um data center comercial de varejo de meio megawatt para tudo e todos. O cliente pode não apenas alugar equipamentos já instalados, mas também colocar seus próprios equipamentos, incluindo dispositivos não padronizados, como servidores em gabinetes convencionais para PCs desktop, fazendas de mineração ou sistemas de inteligência artificial. Simplificando, essas são uma variedade de tarefas populares mais procuradas por empresas domésticas de vários graus de magnitude. Isso é o que o torna interessante. Neste post você não encontrará soluções técnicas exclusivas e a fuga do pensamento da engenharia. Falaremos sobre problemas e soluções padrão. Ou seja, cerca de 90% dos especialistas têm 90% de seu tempo de trabalho.

Nível - quanto mais, melhor?

A tolerância a falhas do centro de dados Tushino corresponde ao nível Tier II. Em essência, isso significa que o data center está localizado em uma sala preparada normal, fontes de alimentação redundantes são usadas e há recursos de sistema redundantes.

No entanto, ao contrário de um equívoco comum, os níveis de Tier não caracterizam a "resistência" do data center, mas o grau de conformidade com as tarefas comerciais reais. E entre eles há muitos para os quais a alta tolerância a falhas é insignificante ou não é tão importante a ponto de pagar a mais de 20 a 25 mil rublos por ano, o que em uma crise pode ser muito doloroso para o cliente.

De onde veio tal quantia? É ela quem faz a diferença entre os preços de colocação de informações nos datacenters Tier II e Tier III em termos de um servidor. Quanto mais dados, maior o potencial de economia.

Que tarefas você quer dizer? Por exemplo, armazenar backups ou minerar criptomoedas. Nesses casos, um servidor com tempo de inatividade permitido pelo Tier II custará menos que o Tier III.

A prática mostra que, na maioria dos casos, a economia é mais importante do que o aumento da tolerância a falhas. Existem apenas cinco data centers certificados Tier III em Moscou. E não há Tier IVs totalmente certificados.

Como é organizado o sistema de fornecimento de energia do data center Tushino?

Os requisitos para o sistema de alimentação do centro de dados Tushino estão em conformidade com as condições de nível Tier II. São a redundância de linhas de energia de acordo com o esquema N + 1, a redundância de fontes de alimentação ininterrupta de acordo com o esquema N + 1 e a redundância do grupo gerador a diesel de acordo com o esquema N. N + 1 neste caso significa um esquema com um elemento de reserva que permanece ocioso até que o sistema não seja um dos principais elementos falhará, e N é um esquema não redundante, no qual a falha de qualquer elemento leva à cessação de todo o sistema

Muitos problemas relacionados à energia são resolvidos com a escolha do local certo para o data center. O data center de Tushino está localizado no território da empresa, de onde já vêm duas linhas de 110 kV de diferentes usinas da cidade. No equipamento da própria usina, a alta tensão é convertida em média tensão e duas linhas independentes de 10 kV são alimentadas na entrada do data center.

A subestação transformadora dentro do prédio do data center converte a média tensão em consumo de 240-400 V. Todas as linhas são executadas em paralelo, de modo que o equipamento do data center é alimentado por duas fontes externas independentes.

A baixa tensão das subestações transformadoras é conectada a comutadores de transferência automática, que fornecem comutação entre as redes da cidade. Os acionamentos do motor instalados no ATS requerem 1,2 segundos para esta operação. Todo esse tempo, a carga recai sobre a fonte de alimentação ininterrupta.

Um ATS separado é responsável por ligar automaticamente o gerador a diesel no caso de falta de energia em ambas as linhas. O arranque de um gerador a diesel não é um processo rápido e requer cerca de 40 segundos, durante os quais a alimentação é totalmente suportada pelas baterias da UPS.

Com carga total, o gerador a diesel garante a operação do data center por 8 horas. Pensando nisso, o data center firmou dois contratos com fornecedores de óleo diesel independentes entre si, que se comprometeram a entregar uma nova porção de combustível em até 4 horas após a ligação. A probabilidade de ambos terem algum tipo de força maior ao mesmo tempo é extremamente baixa. Assim, a autonomia pode durar enquanto as equipes de reparo precisarem restaurar a energia de pelo menos uma das redes da cidade.

Como você pode ver, não há frescuras de engenharia aqui. Isso se deve, entre outras coisas, ao fato de que na construção da infraestrutura de engenharia foram utilizados módulos prontos, cujos fabricantes são orientados por um certo “consumidor médio”.

Obviamente, qualquer profissional de TI dirá que a média não é “nem peixe nem ave” e sugerirá o desenvolvimento de um conjunto exclusivo de componentes para um sistema específico. No entanto, aqueles que querem pagar por esse prazer claramente não fazem fila. Portanto, você tem que ser realista. Na prática, tudo será exatamente assim: a compra de equipamentos prontos e a montagem de um sistema que resolverá tarefas relevantes para o negócio. Aqueles que discordarem dessa abordagem serão rapidamente trazidos de volta do céu à terra pelo diretor financeiro da empresa.

Quadros de distribuição

Neste momento, nove quadros asseguram o funcionamento dos dispositivos de distribuição de entrada e quatro quadros são utilizados diretamente para ligar a carga. Não havia restrições sérias no local, mas nunca há muito, então um momento interessante da engenharia ainda estava presente.

Como é fácil ver, o número de escudos de "entrada" e "carga" não coincide - o segundo é quase duas vezes menor. Isso se tornou possível porque os projetistas da infraestrutura do data center decidiram usar shields grandes para trazer três ou mais linhas de entrada para lá. Para cada autômato de entrada, existem aproximadamente 36 linhas de saída protegidas por autômatos separados.

Assim, às vezes o uso de modelos maiores economiza espaço escasso. Simplesmente porque grandes escudos exigirão menos.

Fontes de alimentação ininterrupta

O Eaton 93PM com capacidade de 120 kVA, operando em modo de dupla conversão, é usado como fonte de alimentação ininterrupta no data center de Tushino.

Como construímos um sistema de alimentação de backup no data center de Tushino: engenharia e finanças
Os no-breaks Eaton 93PM estão disponíveis em diferentes versões. Foto: Eaton

As principais razões para escolher este dispositivo em particular são as seguintes características.

Em primeiro lugar, a eficiência desta UPS é de até 97% no modo de dupla conversão e 99% no modo de economia de energia. O dispositivo ocupa menos de 1,5 metros quadrados. m e não ocupa espaço na sala do servidor do equipamento principal. O resultado são baixos custos operacionais e a economia de que sua empresa precisa.

Em segundo lugar, graças ao sistema de gerenciamento térmico integrado, o UPS Eaton 93PM pode ser colocado em qualquer lugar. Mesmo perto da parede. Mesmo que não seja necessário imediatamente, pode ser necessário mais tarde. Por exemplo, para liberar algum espaço que não é suficiente para um rack adicional.

Terceiro, facilidade de operação. Incluindo - Software Intelligent Power usado para monitoramento e controle. As métricas transmitidas via SNMP permitem controlar os consumos e algumas falhas globais, o que permite responder rapidamente a situações de emergência.

Quarto, modularidade e escalabilidade. Esta é talvez a qualidade mais importante, devido à qual apenas um UPS modular é usado no sistema de redundância do centro de dados Tushino. Inclui dois módulos de trabalho e um redundante. Isso fornece o esquema N+1 necessário para o nível Tier II.

Isso é muito mais simples e confiável do que uma configuração de três UPS. Portanto, a escolha de um dispositivo que inicialmente forneça a possibilidade de operação paralela é um movimento completamente lógico.

Mas por que os projetistas não escolheram o DRIBP em vez de um no-break separado e um gerador a diesel? As principais razões aqui não estão na engenharia, mas nas finanças.

A estrutura modular é a priori adaptada para atualizações - à medida que a carga cresce, fontes e geradores são adicionados à infraestrutura de engenharia. Ao mesmo tempo, os antigos trabalharam e ainda trabalham. Com o DRIBP, a situação é radicalmente diferente: você precisa comprar esse aparelho com uma grande margem de potência. Além disso, existem poucas “pequenas colheitadeiras” e custam muito decentemente - são incomparavelmente mais caras do que geradores a diesel e UPSs individuais. O DRIBP também é muito caprichoso no transporte e instalação. Isso, por sua vez, também afeta o custo de todo o sistema.

A configuração existente resolve suas tarefas com bastante sucesso. O no-break Eaton 93PM pode manter os principais equipamentos do data center funcionando por 15 minutos, mais de 15 vezes a potência.

Novamente, a onda senoidal pura que o no-break fornece on-line evita que o proprietário do data center tenha que comprar estabilizadores separados. E é aqui que entra a poupança.

Apesar da simplicidade declarada do UPS Eaton 93PM, o dispositivo é bastante complexo. Portanto, sua manutenção no data center Tushino é realizada por uma empresa terceirizada que possui especialistas altamente qualificados em sua equipe. Manter um funcionário treinado em sua própria equipe para esse fim é um prazer caro.

Resultados e perspectivas

Assim foi criado o data center, que permite fornecer serviços de alta qualidade a consumidores cujas tarefas não exigem um alto nível de redundância e não implicam grandes custos econômicos. Esse serviço sempre estará em demanda.

Com a construção já planejada da segunda etapa, um no-break Eaton já adquirido será usado para criar um sistema de alimentação de backup. Devido ao design modular, sua modernização será reduzida à compra de um módulo adicional, que é mais conveniente e barato do que a substituição completa do dispositivo. Essa abordagem será aprovada pelo engenheiro e pelo financiador.

Fonte: habr.com

Adicionar um comentário