Como construímos un sistema de alimentación de reserva no centro de datos de Tushino: enxeñería e finanzas

Como construímos un sistema de alimentación de reserva no centro de datos de Tushino: enxeñería e finanzas

O centro de datos Tushino é un centro de datos comercial de medio megavatio para todo o mundo. O cliente non só pode alugar equipos xa instalados, senón que tamén pode colocar alí o seu propio equipo, incluíndo dispositivos non estándar como servidores en casos convencionais para ordenadores de sobremesa, explotacións mineiras ou sistemas de intelixencia artificial. En pocas palabras, estas son unha variedade de tarefas populares máis demandadas polas empresas nacionais de distintos graos de magnitude. Isto é o que o fai interesante. Neste post non atoparás solucións técnicas exclusivas e o voo do pensamento da enxeñería. Falaremos de problemas e solucións estándar. É dicir, sobre o que o 90% dos especialistas ten o 90% do seu tempo de traballo.

Nivel - canto máis mellor?

A tolerancia a fallos do centro de datos Tushino corresponde ao nivel II. En esencia, isto significa que o centro de datos está situado nunha sala preparada normal, utilízanse fontes de alimentación redundantes e hai recursos do sistema redundantes.

Non obstante, ao contrario dunha idea errónea común, os niveis de nivel non caracterizan a "dureza" do centro de datos, senón o grao de cumprimento das tarefas comerciais reais. E entre eles hai moitos para os que a alta tolerancia ás fallas é insignificante ou non é tan importante como para pagar de máis entre 20 e 25 mil rublos ao ano, o que nunha crise pode ser moi doloroso para o cliente.

De onde saíu tal cantidade? É ela a que marca a diferenza entre os prezos para colocar información nos centros de datos de nivel II e de nivel III en termos dun servidor. Cantos máis datos, maior será o potencial de aforro.

A que tarefas te refires? Por exemplo, almacenar copias de seguridade ou extraer criptomonedas. Nestes casos, un servidor de tempo de inactividade permitido polo Nivel II custará menos que o Nivel III.

A práctica demostra que na maioría dos casos o aforro é máis importante que o aumento da tolerancia a fallos. Só hai cinco centros de datos certificados Tier III en Moscova. E non hai ningún Tier IV totalmente certificado.

Como está disposto o sistema de alimentación do centro de datos de Tushino?

Os requisitos para o sistema de alimentación do centro de datos Tushino cumpre coas condicións do nivel II. Trátase da redundancia das liñas eléctricas segundo o esquema N + 1, a redundancia das fontes de alimentación ininterrompidas segundo o esquema N + 1 e a redundancia do grupo electróxeno diésel segundo o esquema N. N + 1 neste caso significa un esquema cun o elemento de reserva que permanece inactivo ata que o sistema non sexa un dos elementos principais fallará, e N é un esquema non redundante, no que a falla de calquera elemento leva ao cesamento de todo o sistema.

Moitos problemas relacionados coa enerxía resólvense escollendo a localización correcta para o centro de datos. O centro de datos de Tushino está situado no territorio da empresa, onde xa veñen dúas liñas de 110 kV de diferentes centrais eléctricas da cidade. No propio equipamento da planta, a alta tensión convértese en media tensión, e se alimentan dúas liñas independentes de 10 kV á entrada do centro de datos.

A subestación transformadora dentro do edificio do centro de datos converte a media tensión en consumidores 240-400 V. Todas as liñas funcionan en paralelo, polo que o equipo do centro de datos está alimentado por dúas fontes externas independentes.

A baixa tensión das subestacións transformadoras está conectada a interruptores de transferencia automática, que proporcionan a conmutación entre as redes da cidade. Os accionamentos de motor instalados no ATS requiren 1,2 segundos para esta operación. Durante todo este tempo, a carga recae na fonte de alimentación ininterrompida.

Un ATS separado é o responsable de acender automaticamente o xerador diésel no caso de que se perda enerxía en ambas liñas. O arranque dun xerador diésel non é un proceso rápido e require uns 40 segundos, durante os cales a subministración de enerxía é totalmente soportada polas baterías do SAI.

Cunha carga completa, o xerador diésel asegura o funcionamento do centro de datos durante 8 horas. Con isto en mente, o centro de datos celebrou dous contratos con provedores de gasóleo independentes entre si, que se comprometeron a entregar unha nova porción de combustible nun prazo de 4 horas despois da chamada. A probabilidade de que ambos teñan algún tipo de forza maior á vez é extremadamente baixa. Así, a autonomía pode durar mentres os equipos de reparación necesiten restablecer a enerxía desde polo menos unha das redes da cidade.

Como podes ver, aquí non hai adornos de enxeñería. Isto débese, entre outras cousas, ao feito de que ao construír a infraestrutura de enxeñería utilizáronse módulos preparados, cuxos fabricantes están guiados por un determinado "consumidor medio".

Por suposto, calquera profesional de TI dirá que a media non é "nin peixe nin ave" e suxerirá desenvolver un conxunto único de compoñentes para un sistema en particular. Non obstante, os que queren pagar por este pracer claramente non están facendo cola. Polo tanto, tes que ser realista. Na práctica, todo será exactamente así: a compra de equipos preparados e a montaxe dun sistema que resolva problemas relevantes para o negocio. Aqueles que non estean de acordo con este enfoque serán traídos rapidamente do ceo á terra polo director financeiro da empresa.

Cadros de distribución

Polo momento, nove cadros aseguran o funcionamento dos dispositivos de distribución de entrada e catro cadros utilízanse directamente para conectar a carga. Non houbo restricións serias no lugar, pero nunca hai moitas, polo que aínda estaba presente un momento de enxeñería interesante.

Como é fácil de ver, o número de escudos de "entrada" e "carga" non coincide: o segundo é case dúas veces menos. Isto fíxose posible porque os deseñadores da infraestrutura do centro de datos decidiron usar grandes escudos para levar alí tres ou máis liñas de entrada. Para cada autómata de entrada, hai aproximadamente 36 liñas de saída, protexidas por autómatas separados.

Así, ás veces o uso de modelos máis grandes aforra espazo escaso. Simplemente porque os escudos grandes requirirán menos.

Alimentacións ininterrompidas

O Eaton 93PM cunha capacidade de 120 kVA, que funciona en modo de dobre conversión, utilízase como fonte de alimentación ininterrompida no centro de datos de Tushino.

Como construímos un sistema de alimentación de reserva no centro de datos de Tushino: enxeñería e finanzas
Os UPS Eaton 93PM están dispoñibles en diferentes versións. Foto: Eaton

As principais razóns para escoller este dispositivo en particular son as súas seguintes características.

En primeiro lugar, a eficiencia deste SAI é de ata o 97% en modo de dobre conversión e o 99% en modo de aforro de enerxía. O dispositivo ocupa menos de 1,5 metros cadrados. m e non ocupa espazo da sala de servidores do equipo principal. O resultado son custos operativos baixos e o aforro que necesita a súa empresa.

En segundo lugar, grazas ao sistema de xestión térmica incorporado, o UPS Eaton 93PM pódese colocar en calquera lugar. Mesmo preto da parede. Aínda que non sexa necesario de inmediato, pode ser necesario máis tarde. Por exemplo, para liberar espazo que non é suficiente para un rack adicional.

En terceiro lugar, a facilidade de operación. Incluíndo - Software Intelligent Power usado para a monitorización e control. As métricas transmitidas a través de SNMP permiten controlar o consumo e algúns fallos globais, o que permite responder rapidamente ás emerxencias.

En cuarto lugar, a modularidade e escalabilidade. Esta é quizais a calidade máis importante, debido á que só se usa un UPS modular no sistema de redundancia do centro de datos Tushino. Inclúe dous módulos de traballo e outro redundante. Isto proporciona o esquema N+1 necesario para o nivel II.

Isto é moito máis sinxelo e fiable que unha configuración de tres UPS. Polo tanto, a elección dun dispositivo que inicialmente prevé a posibilidade de funcionar en paralelo é un movemento completamente lóxico.

Pero por que os deseñadores non escolleron DRIBP en lugar dun UPS separado e un xerador diésel? As principais razóns aquí non residen na enxeñería, senón nas finanzas.

A estrutura modular está a priori adaptada para as actualizacións: a medida que a carga crece, as fontes e os xeradores engádense á infraestrutura de enxeñería. Ao mesmo tempo, os vellos traballaban e seguen traballando. Con DRIBP, a situación é radicalmente diferente: cómpre mercar un dispositivo deste tipo cunha gran marxe de potencia. Ademais, hai poucas "pequenas cosechadoras" e custan moi decentemente: son incomparablemente máis caras que os xeradores diésel e os UPS individuais. DRIBP tamén é moi caprichoso no transporte e instalación. Isto, á súa vez, tamén afecta o custo de todo o sistema.

A configuración existente resolve as súas tarefas con bastante éxito. O UPS Eaton 93PM pode manter os equipos clave do centro de datos funcionando durante 15 minutos, máis de 15 veces a potencia.

De novo, a onda sinusoidal pura que o UPS ofrece en liña evita que o propietario do centro de datos teña que comprar estabilizadores separados. E aquí é onde entran os aforros.

A pesar da sinxeleza declarada do UPS Eaton 93PM, o dispositivo é bastante complexo. Polo tanto, o seu mantemento no centro de datos de Tushino realízao unha empresa allea que conta con especialistas altamente cualificados no seu persoal. Manter un empregado capacitado no seu propio persoal para este fin é un pracer caro.

Resultados e perspectivas

Así se creou o centro de datos, que permite ofrecer servizos de alta calidade a consumidores cuxas tarefas non requiren un alto nivel de redundancia e non supoñen grandes custos económicos. Tal servizo sempre será demandado.

Coa construción xa planificada da segunda etapa, utilizarase un UPS Eaton xa adquirido para crear un sistema de alimentación de reserva. Debido ao deseño modular, a súa modernización reducirase á compra dun módulo adicional, que é máis cómodo e máis barato que unha substitución completa do dispositivo. Este enfoque será aprobado tanto polo enxeñeiro como polo financeiro.

Fonte: www.habr.com

Engadir un comentario