Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Olá a todos. Como prometemos, estamos mergulhando os leitores da Habr nos detalhes da produção de plataformas de hardware russas para sistemas de armazenamento Aerodisk Vostok em processadores Elbrus. Neste artigo descreveremos passo a passo a produção da plataforma Yakhont-UVM E124, que comporta efetivamente 5 discos em 124 unidades, pode operar a uma temperatura de +30 graus Celsius e ao mesmo tempo não apenas funciona, mas funciona bem.

Também estamos organizando um webinar no dia 05.06.2020/XNUMX/XNUMX, onde falaremos detalhadamente sobre as nuances técnicas da produção do sistema de armazenamento Vostok e tiraremos quaisquer dúvidas. Você pode se inscrever no webinar usando o link: https://aerodisk.promo/webinarnorsi/

Então lá vai!

Antes de mergulhar no processo que está sendo organizado agora, um pouco de histórico de dois anos atrás. Na altura em que começou o desenvolvimento das plataformas descritas neste artigo, as condições para a sua produção eram, para dizer o mínimo, inexistentes. Há razões para isso, são conhecidas de todos: a produção em massa (ou seja, a produção, e não a colagem de adesivos) de plataformas de servidor na Rússia estava ausente como classe. Existiam fábricas separadas que podiam produzir componentes individuais, mas de uma forma muito limitada e muitas vezes baseadas em tecnologias ultrapassadas. Portanto, tivemos que começar praticamente “do zero” e ao mesmo tempo elevar a produção de soluções de servidores na Rússia a um nível qualitativamente novo.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Assim, o processo de qualquer produção começa com uma necessidade, que depois se transforma em requisitos gerais. Tais requisitos são inicialmente formados pelos desenvolvedores do NORSI-TRANS em Nizhny Novgorod. Os requisitos, é claro, não são tirados do nada, mas das necessidades dos clientes. Esta ainda não é uma tarefa técnica, como pode parecer erroneamente. Na fase de requisitos gerais, é impossível elaborar uma especificação técnica completa, uma vez que existem muitas condições de produção desconhecidas.

Desenvolvimento de um modelo alvo: da ideia à implementação

Após a formação dos requisitos gerais, inicia-se a seleção da base do elemento. Das informações históricas conclui-se que o elemento base não existe, ou seja, deve ser criado.

Para isso, é montada uma amostra piloto a partir do que está disponível no mercado aberto, que é pelo menos um pouco semelhante à amostra-alvo. A seguir, são realizados testes padrão desta amostra para determinar seu desempenho. Se tudo estiver bem, o próximo passo é desenvolver o modelo alvo (2D e 3D).

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Começa então a busca por empresas russas que estejam prontas para iniciar a produção deste piloto.Os desenvolvedores realizam as modificações necessárias em cada um dos elementos do produto, com base nas capacidades de uma determinada empresa.

Durante o processo de design, são realizadas as modificações necessárias em cada um dos elementos do produto. Por exemplo, ao trabalhar com o protótipo, foram utilizados expansores SAS 12G clássicos com grande número de fios (muito grandes, dada a quantidade de discos). Não é barato, é inconveniente para esta plataforma específica e, além disso, os expansores do inimigo são estrangeiros. Mas esta é uma solução temporária para testar a amostra como um todo e passar para a próxima etapa. Entretanto, não é adequado usar expansores SAS para a versão final em uma plataforma de servidor específica.

Não precisamos de expansores inimigos, faremos nosso próprio backplane com blackjack e sh...

Tendo em conta os planos futuros de volumes de produção (milhares de servidores), optou-se por desenvolver para este produto (e, claro, para os subsequentes) o nosso próprio backplane SAS, que é muito mais funcional que um expansor em relação a esta solução . O projeto e a programação do backplane são realizados pela mesma equipe de desenvolvedores, e a produção das placas é realizada na fábrica da Microlit na região de Moscou (prometemos um artigo separado sobre esta planta e como as placas-mãe para processadores Elbrus são impresso lá).

Aliás, aqui está o seu primeiro protótipo, agora parece completamente diferente.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

E aqui estão eles programando

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Fato interessante: quando o desenvolvimento do backplane começou e os designers recorreram ao desenvolvedor do chip SAS3 para um design de placa de referência, descobriu-se que nem uma única empresa na Europa sabia como desenvolver seus próprios backplanes. Anteriormente, existia uma joint venture Fujitsu-Siemens, mas após a saída da Siemens Nixdorf Informations systeme AG da joint venture e o encerramento total do departamento de informática da Siemens, a competência nesta área na Europa foi perdida.

Portanto, o desenvolvedor do chip inicialmente não levou a sério o desenvolvimento do NORSI-TRANS, o que causou atrasos no desenvolvimento do design final. É verdade que mais tarde, quando a seriedade das intenções e competência da empresa NORSI-TRANS se tornou evidente, e o backplane foi desenvolvido e impresso, a sua atitude mudou para melhor.

Como resfriar 124 discos e um servidor em 5 unidades e permanecer vivo?

Houve uma missão separada com comida e resfriamento. O fato é que, de acordo com os requisitos, a plataforma E124 deve operar a uma temperatura de 30 graus Celsius, e aí, por um minuto, 124 discos mecânicos bem aquecidos em 5 unidades e, além disso, uma placa-mãe com processador (ou seja, este não é um JBOD estúpido, mas um controlador de sistema de armazenamento completo com discos).

Para resfriamento (exceto para as pequenas ventoinhas internas), decidimos usar três ventoinhas bastante grandes na parte traseira do gabinete, cada uma com troca a quente. Para o funcionamento normal do sistema bastam dois (a temperatura não muda em nada), para que você possa planejar com segurança o trabalho de substituição dos ventiladores e não pensar na temperatura. Se você desligar dois ventiladores (por exemplo, de acordo com a lei da maldade, enquanto um estava sendo substituído, o segundo quebrou), então com um ventilador o sistema também pode funcionar normalmente, mas a temperatura aumentará em 10-20% por cento, o que é aceitável desde que pelo menos mais um ventilador seja instalado em breve.

Os fãs (como quase todo o resto) também se revelaram únicos. A razão para a singularidade foi um custo. Em certas condições, pode acontecer que os ventiladores, ao invés de sugar o ar, soprando todo o gabinete por dentro, comecem a sugá-lo, e então “adeus”, ou seja, a plataforma superaquecerá rapidamente. Portanto, para evitar tal problema, foram feitas alterações no design do ventilador e adicionamos nosso próprio “know-how” - uma válvula de retenção. Esta válvula de retenção permite que o ar seja sugado silenciosamente para fora da plataforma, mas ao mesmo tempo bloqueia a possibilidade de sugar o ar de volta em qualquer caso.

Na fase de pilotagem do sistema de refrigeração, ocorreram muitas falhas, vários elementos do sistema superaqueceram e queimaram, mas no final, os desenvolvedores da plataforma conseguiram obter um resfriamento melhor do que até mesmo concorrentes mundialmente famosos.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

“A dieta não pode ser violada.”

Foi uma história semelhante com fontes de alimentação, ou seja, foram feitos especificamente para esta plataforma e o motivo é banal. Cada unidade custa muito dinheiro, por isso foi desenvolvida uma plataforma tão superdensa e, se não me engano (corrija nos comentários se estiver errado), este é um recorde mundial até agora, porque Ainda não existem servidores ou JBODs com grande número de discos para 5 unidades.

Assim, para fornecer energia à plataforma e ao mesmo tempo organizar a possibilidade de substituição da fonte de alimentação em modo normal, a potência total das unidades ativas deveria ser de 4 quilowatts (claro que não existem tais soluções no mercado), portanto foram feitos sob encomenda com o lançamento de uma linha de produção para produção em massa (Lembro que existem planos para milhares desses servidores).

Como disse um dos principais designers da plataforma: “As correntes aqui são como em uma máquina de solda - isso não é muito divertido :-)”

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Durante o projeto também foi possível operar a fonte de alimentação não apenas em 220V, mas também em 48V, ou seja, na arquitetura OPC, que hoje é muito importante para operadoras de telecomunicações e grandes data centers.

Com isso, a solução com fonte de alimentação repete a lógica da solução com refrigeração: a plataforma pode operar confortavelmente com duas fontes de alimentação, o que permite realizar trabalhos de substituição normalmente. Se em caso de acidente sobrar apenas uma fonte de alimentação entre três, ela poderá arrancar o trabalho da plataforma em pico de carga, mas, claro, é impossível sair da plataforma desta forma por muito tempo.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Metal e plástico: nem tudo é tão simples, ao que parece.

Existem muitas nuances no processo de desenvolvimento da plataforma. Situação semelhante ocorreu não apenas com componentes eletrônicos (risers, backplanes, placas-mãe, etc.), mas também com metal e plástico comuns: por exemplo, com o gabinete, trilhos e até mesmo carrinhos de disco.

Parece que não deverá haver problemas com o corpo e outros elementos menos inteligentes da plataforma. Mas na prática tudo é diferente. Quando os desenvolvedores da plataforma abordaram pela primeira vez várias fábricas russas com necessidades de produção, descobriu-se que a maioria delas trabalhava usando métodos pouco modernos, o que acabou afetando tanto a qualidade quanto a quantidade dos produtos.

Os primeiros resultados da produção de casos confirmaram isso. Geometria incorreta, soldas ásperas, furos imprecisos e custos semelhantes tornaram o produto inadequado para uso.

A maioria das fábricas que poderiam fazer gabinetes de servidores funcionavam naquela época (deixe-me lembrar que por “então” queremos dizer 2 anos atrás) “à moda antiga”, ou seja, elas produziam um monte de documentação de design, de acordo com a qual o o operador ajustava manualmente a operação das máquinas e, muitas vezes, em vez de rebites, era usada soldagem de metal. Como resultado, o baixo grau de automação, o fator humano e a excessiva burocratização da produção deram frutos. Acabou sendo longo, ruim e caro.

Devemos prestar homenagem às fábricas: muitas delas modernizaram enormemente a sua produção desde então. Melhoramos a qualidade da soldagem, dominamos a rebitagem e também começamos a usar máquinas de controle numérico computadorizado (CNC). Agora, em vez de uma tonelada de documentos, os dados do produto são carregados diretamente de modelos 3D e 2D no CNC.

O CNC reduz ao mínimo a intervenção do operador da máquina no processo de fabricação do produto, para que o fator humano não interfira mais na vida. A principal preocupação do operador reside principalmente nas operações preparatórias e finais: instalação e remoção do produto, montagem de ferramentas, etc.

Quando aparecem novas peças, a produção não para mais, para produzi-las basta fazer alterações no software CNC. Assim, o tempo de produção de peças para novos projetos nas fábricas foi reduzido de meses para semanas, o que é uma boa notícia. E, claro, a precisão também aumentou bastante.

Placas-mãe e processador: sem problemas

Processadores e placas-mãe vêm como um conjunto de fábrica. Esta produção já está bastante consolidada, pelo que a NORSI realiza o controlo standard de entradas e saídas ao nível das plataformas acabadas.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Cada conjunto de placa-mãe e processador é testado com software obtido da MCST.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

No caso de certos problemas (graças a Deus, são poucos com a placa-mãe e o processador), existe uma cadeia que funciona bem de devolução dos módulos ao fabricante e sua substituição.

Montagem e controle final

Para que nossa balalaica comece a tocar, falta montá-la e testá-la. Agora que a produção está em andamento, o sistema é montado de forma padrão em Moscou.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Cada sistema vem com SSDs de inicialização (para o sistema operacional) e eixos completos (para dados futuros).

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Depois disso, inicia-se o teste de entrada da própria plataforma e dos discos nela instalados. Para fazer isso, todos os discos do sistema são carregados com testes automáticos por pelo menos uma hora.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

A leitura e gravação automática são realizadas em cada disco, registrando a velocidade de leitura, velocidade de gravação e temperatura de cada disco. No modo normal, a temperatura média deve estar em torno de 30-35 graus Celsius. Nos picos, cada disco individual pode “saltar” até 40 graus. Se a temperatura subir ou a velocidade cair abaixo dos limites de leitura e gravação, o disco ficará vermelho e não será rejeitado. Os componentes que passaram nos testes são embalados para uso posterior.

Como o hardware russo é feito para o sistema de armazenamento Aerodisk Vostok no Elbrus

Conclusão

Existe um mito, apoiado ativamente por várias figuras, de que “na Rússia eles não sabem fazer nada além de bombear petróleo”. Infelizmente, esse mito corrói a cabeça até de pessoas respeitadas e inteligentes.

Recentemente, uma história notável aconteceu com um colega meu. Ele estava dirigindo a partir de um dos displays do sistema de armazenamento Vostok e esse sistema de armazenamento estava no porta-malas de seu carro (não o E124, é claro, é mais simples). No caminho, ele capturou um dos representantes do cliente (uma pessoa muito importante, que trabalha em alto cargo em um dos órgãos governamentais), e no carro tiveram aproximadamente a seguinte conversa:

Meu colega: “Acabamos de mostrar o sistema de armazenamento no Elbrus, os resultados foram bons, todos ficaram felizes, aliás, esse sistema de armazenamento também será útil para a sua indústria.”

Cliente: “Eu sei que você tem sistemas de armazenamento, mas de que tipo de Elbrus você está falando?”

Meu colega: “Bem... o processador russo Elbrus, eles lançaram recentemente 8, em termos de desempenho para sistemas de armazenamento, nós, portanto, fizemos uma nova linha de sistemas de armazenamento nele, chamada Vostok”

Cliente: “Elbrus é uma montanha! E não contem contos de fadas sobre o processador russo na sociedade educada, tudo isso está sendo feito apenas para absorver orçamentos, na realidade não há nada e nada vai acontecer.”

Meu colega: "Em termos de? Está tudo bem se este sistema de armazenamento específico estiver no meu porta-malas? Vamos parar agora, vou te mostrar!”

Cliente: “É bom sofrer com bobagens, vamos em frente, não existem “sistemas de armazenamento russos” - isso é basicamente impossível”

Naquele momento, a pessoa importante não queria ouvir mais nada sobre Elbrus. Claro que mais tarde, ao esclarecer a informação, admitiu que estava errado, mas mesmo assim, até ao final, não acreditou na veracidade desta informação.

Na verdade, após o colapso da URSS, nosso país parou de desenvolver a produção de microeletrônica. Algo foi exportado e roubado em benefício das corporações transnacionais, algo foi roubado pela empresa local de privatização, algo, claro, foi investido, mas principalmente em benefício das mesmas corporações transnacionais. A árvore foi cortada, mas a raiz permaneceu.

Depois de quase 30 anos de ilusões sobre o tema “o Ocidente vai nos ajudar”, tornou-se óbvio para quase todos que só podemos ajudar a nós mesmos, por isso precisamos restaurar nossa produção não apenas no campo da microeletrônica, mas em todas as indústrias .

Neste momento, no contexto de uma pandemia global, numa situação em que as cadeias de produção transnacionais pararam, já está a tornar-se claro que a restauração da produção local já não é o desenvolvimento de orçamentos, mas uma condição para a sobrevivência da Rússia como um estado independente.

Portanto, continuaremos procurando e usando equipamentos russos na vida e contando a vocês o que nossas empresas realmente fazem, quais problemas enfrentam e quais esforços titânicos fazem para resolvê-los.

É muito difícil falar sobre todos os aspectos da produção em um artigo, então como bônus organizaremos uma discussão online em formato de webinar sobre este tema. Neste webinar, falaremos em detalhes e em cores vivas sobre os aspectos técnicos da produção de plataformas Yakhont para sistemas de armazenamento Vostok e responderemos a todas as perguntas online, até mesmo as mais complicadas.

Nosso interlocutor será um representante do desenvolvedor da plataforma, empresa NORSI-TRANS. O webinar acontecerá no dia 05.06.2020/XNUMX/XNUMX; quem quiser participar poderá se inscrever pelo link: https://aerodisk.promo/webinarnorsi/ .

Obrigado a todos, como sempre, aguardamos comentários construtivos.

Fonte: habr.com

Adicionar um comentário