Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Ola a todos. Como prometemos, estamos mergullando os lectores Habr nos detalles da produción de plataformas de hardware rusas para os sistemas de almacenamento Aerodisk Vostok nos procesadores Elbrus. Neste artigo imos describir paso a paso a produción da plataforma Yakhont-UVM E124, que contén 5 discos en 124 unidades, pode funcionar a unha temperatura de +30 graos Celsius e, ao mesmo tempo, non só funciona, senón que funciona. ben.

Tamén estamos organizando un webinar o 05.06.2020/XNUMX/XNUMX, onde falaremos en detalle sobre os matices técnicos da produción do sistema de almacenamento Vostok e responderemos a calquera dúbida. Podes rexistrarte no seminario web a través da ligazón: https://aerodisk.promo/webinarnorsi/

Así que imos!

Antes de mergullarse no proceso que se está a organizar agora, un pequeno antecedente histórico de hai dous anos. No momento en que comezou o desenvolvemento das plataformas descritas neste artigo, as condicións para a súa produción eran, por dicilo suavemente, inexistentes. Hai razóns para iso, son coñecidas por todos: a produción en masa (é dicir, a produción, non o re-pegado de adhesivos) de plataformas de servidores en Rusia estaba ausente como clase. Había fábricas separadas que podían producir compoñentes individuais, pero de forma moi limitada e moitas veces baseadas en tecnoloxías obsoletas. Polo tanto, tivemos que comezar practicamente "desde cero" e, ao mesmo tempo, elevar a produción de solucións de servidor en Rusia a un nivel cualitativamente novo.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Así, o proceso de calquera produción comeza cunha necesidade, que logo se transforma en requisitos xerais. Tales requisitos son inicialmente formados polos desenvolvedores de NORSI-TRANS en Nizhny Novgorod. Os requisitos, por suposto, non se sacan da nada, senón das necesidades dos clientes. Esta aínda non é unha tarefa técnica, como pode parecer erróneamente. Na fase de requisitos xerais, é imposible facer unha especificación técnica completa, xa que hai demasiadas condicións descoñecidas para a produción.

Desenvolvemento dun modelo obxectivo: da idea á implementación

Despois de formar os requisitos xerais, comeza a selección da base do elemento. Da información histórica despréndese que a base do elemento non existe, é dicir, hai que creala.

Para iso recóllese unha mostra piloto a partir do que hai no mercado aberto, polo menos algo semellante ao obxectivo. A continuación, realízanse probas estándar desta mostra para determinar o seu rendemento. Se todo é bo, entón o seguinte paso é desenvolver o modelo de destino (2D e 3D).

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

A continuación, comeza a busca de empresas rusas listas para comezar a produción deste piloto.Os desenvolvedores realizan as modificacións necesarias en cada un dos elementos do produto, en función das capacidades dunha empresa en particular.

Durante o proceso de deseño realízanse as modificacións necesarias en cada un dos elementos do produto. Por exemplo, mentres se traballaba co prototipo, utilizáronse expansores SAS 12G clásicos cunha gran cantidade de cables (moi grandes, dada a cantidade de discos). Non é barato, é un inconveniente para esta plataforma en particular e, ademais, os expansores do inimigo son estranxeiros. Pero esta é unha solución temporal para probar a mostra no seu conxunto e pasar á seguinte fase. Non obstante, non é adecuado usar expansores SAS para a versión final nunha plataforma de servidor específica.

Non necesitamos expansores inimigos, faremos o noso propio backplane con blackjack e sh...

Tendo en conta os plans futuros de volumes de produción (miles de servidores), decidiuse desenvolver para este produto (e, por suposto, para os posteriores) o noso propio backplane SAS, moito máis funcional que un expansor en relación a esta solución. . O deseño e a programación do backplane realízase polo mesmo equipo de desenvolvedores e a produción das placas realízase na planta Microlit na rexión de Moscova (prometemos un artigo separado sobre esta planta e como son as placas base para procesadores Elbrus). impreso alí).

Por certo, aquí está o seu primeiro prototipo, agora parece completamente diferente.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

E aquí están a programar

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Un dato interesante: cando comezou o desenvolvemento do backplane e os deseñadores recorreron ao desenvolvedor do chip SAS3 para un deseño de placa de referencia, resultou que nin unha soa empresa en Europa sabía como desenvolver os seus propios backplanes. Anteriormente, existía unha empresa conxunta Fujitsu-Siemens, pero despois de que Siemens Nixdorf Informations systeme AG abandonase a empresa conxunta e o peche completo do departamento de informática de Siemens, a competencia nesta área en Europa perdeuse.

Polo tanto, o desenvolvedor de chips inicialmente non tomou en serio os desenvolvementos de NORSI-TRANS, o que provocou atrasos no desenvolvemento do deseño final. Certo, máis tarde, cando a seriedade das intencións e competencia da empresa NORSI-TRANS se fixo evidente, e o backplane foi desenvolvido e impreso, a súa actitude cambiou para mellor.

Como arrefriar 124 discos e un servidor en 5 unidades e manterse vivo?

Houbo unha misión separada con comida e refrixeración. O caso é que, en función dos requisitos, a plataforma E124 debe funcionar a unha temperatura de 30 graos centígrados, e alí, durante un minuto, 124 discos mecánicos ben quentados en 5 unidades e, ademais, unha placa base con procesador (i.e. este non é un JBOD estúpido, senón un controlador de sistema de almacenamento completo con discos).

Para o arrefriamento (excepto os pequenos ventiladores do interior), finalmente decidimos usar tres ventiladores bastante grandes na parte traseira da caixa, con cada un intercambiable en quente. Para o funcionamento normal do sistema, dous son suficientes (a temperatura non cambia en absoluto), polo que pode planificar con seguridade o traballo de substitución dos ventiladores e non pensar na temperatura. Se apagas dous ventiladores (por exemplo, segundo a lei de maldade, mentres un estaba a ser substituído, o segundo rompeu), entón cun ventilador o sistema tamén pode funcionar normalmente, pero a temperatura aumentará nun 10-20% por cento, o que é aceptable sempre que en breve se instale polo menos un ventilador máis.

Os seguidores (como case todo) tamén resultaron ser únicos. O motivo da singularidade foi un custo. En certas condicións, pode ocorrer que os ventiladores, en lugar de succionar aire, soplando todo o caso desde o interior, poidan comezar a aspiralo e, a continuación, "adeus", é dicir, a plataforma sobrequentarase rapidamente. Polo tanto, para evitar tal problema, fixéronse cambios no deseño do ventilador e engadimos o noso propio "saber facer": unha válvula de retención. Esta válvula de retención permite con calma aspirar o aire da plataforma, pero ao mesmo tempo bloquea a posibilidade de aspirar o aire de volta en calquera caso.

Na fase de pilotaxe do sistema de refrixeración, houbo moitos fallos, varios elementos do sistema sobrequentáronse e arderon, pero ao final, os desenvolvedores da plataforma lograron un mellor arrefriamento que incluso os competidores de fama mundial.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

"Non se pode violar a dieta".

Foi unha historia semellante coas fontes de alimentación, é dicir. fixéronse expresamente para esta plataforma e a razón é banal. Cada unidade supón moito diñeiro, polo que se desenvolveu unha plataforma tan súper densa e, se non me equivoco (correcto nos comentarios se me equivoco), este é un récord mundial ata agora, porque Aínda non hai servidores nin JBOD cunha gran cantidade de discos para 5 unidades.

Así, para proporcionar enerxía á plataforma e, ao mesmo tempo, organizar a posibilidade de substituír a fonte de alimentación en modo normal, a potencia total das unidades activas tiña que ser de 4 quilovatios (por suposto, non hai tales solucións na mercado), polo que se fixeron por encargo co lanzamento dunha liña de produción para a produción en masa (Déixame lembrar que hai plans para miles deste tipo de servidores).

Como dixo un dos principais deseñadores da plataforma: "As correntes aquí son como nunha máquina de soldar; isto non é moi divertido :-)"

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Durante o deseño, tamén foi posible operar a fonte de alimentación non só a 220 V, senón tamén a 48 V, é dicir. en arquitectura OPC, que agora é moi importante para os operadores de telecomunicacións e os grandes centros de datos.

Como resultado, a solución con fonte de alimentación repite a lóxica da solución con refrixeración; a plataforma pode funcionar comodamente con dúas fontes de alimentación, o que permite realizar traballos de substitución como é habitual. Se, en caso de accidente, só queda unha fonte de alimentación de tres, poderá retirar o traballo da plataforma na máxima carga, pero, por suposto, é imposible abandonar a plataforma desta forma. por moito tempo.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Metal e plástico: non todo é tan sinxelo.

Hai moitos matices no proceso de desenvolvemento da plataforma. Unha situación semellante ocorreu non só cos compoñentes electrónicos (elevadores, placas posteriores, placas base, etc.), senón tamén co metal común e o plástico: por exemplo, co caso, os raíles e mesmo os carros de discos.

Parece que non debería haber problemas co corpo e outros elementos menos intelixentes da plataforma. Pero na práctica todo é diferente. Cando os desenvolvedores da plataforma se achegaron por primeira vez a varias fábricas rusas con necesidades de produción, resultou que a maioría delas traballaban con métodos pouco modernos, o que finalmente afectaba tanto á calidade como á cantidade dos produtos.

Os primeiros resultados da produción de casos convertéronse en confirmación diso. Xeometría incorrecta, soldaduras rugosas, buratos imprecisos e custos similares fixeron que o produto non fose apto para o seu uso.

A maioría das fábricas que podían fabricar casos de servidores funcionaban entón (permítanme lembrar que para "daquela" queremos dicir hai 2 anos) "a forma antiga", é dicir, produciron unha morea de documentación de deseño, de acordo coa que o operador manualmente axustou o funcionamento das máquinas, tamén moitas veces en lugar de remaches soldadura metálica foi usada. Como resultado, o baixo grao de automatización, o factor humano e a excesiva burocratización da produción deron os seus froitos. Resultou longo, malo e caro.

Hai que renderlle unha homenaxe ás fábricas: moitas delas modernizaron moito a súa produción dende aquela. Melloramos a calidade da soldadura, dominamos o remachado e tamén comezamos a utilizar moitas veces máquinas de control numérico por ordenador (CNC). Agora, en lugar dunha tonelada de documentos, os datos do produto cárganse directamente desde modelos 3D e 2D no CNC.

O CNC reduce ao mínimo a intervención do operario da máquina no proceso de fabricación do produto, polo que o factor humano xa non interfire coa vida. A principal preocupación do operador son principalmente as operacións preparatorias e finais: instalación e retirada do produto, posta en marcha de ferramentas, etc.

Cando aparecen pezas novas, a produción xa non se para, para fabricalas basta con facer cambios no software CNC. En consecuencia, o tempo de produción de pezas para novos proxectos nas fábricas reduciuse de meses a semanas, o que é unha boa noticia. E, por suposto, a precisión tamén aumentou moito.

Placas base e procesador: sen problema

Os procesadores e as placas base veñen de fábrica como conxunto. Esta produción xa está bastante consolidada, polo que NORSI realiza un control estándar de entrada e de saída a nivel de plataformas acabadas.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Cada conxunto de placas nai e procesador é probado con software obtido de MCST.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

En caso de certos problemas (gracias a Deus, hai moi poucos coa placa base e o procesador), existe unha cadea que funciona ben de devolver módulos ao fabricante e substituílos.

Montaxe e control final

Para que comece a tocar a nosa balalaika só queda montala e probala. Agora a produción está en marcha, o sistema está montado de forma estándar en Moscova.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Cada sistema vén con SSD de arranque (para o SO) e fusos completos (para datos futuros).

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Despois diso, comezan as probas de entrada tanto da propia plataforma como dos discos instalados nela. Para iso, todos os discos do sistema cárganse con probas automáticas durante polo menos unha hora.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

A lectura e escritura automáticas realízase en cada disco, rexistrando a velocidade de lectura, a velocidade de escritura e a temperatura de cada disco. En modo normal, a temperatura media debe ser de 30-35 graos centígrados. Nos picos, cada disco individual pode "rebotar" ata 40 graos. Se a temperatura aumenta ou a velocidade cae por debaixo dos limiares de lectura e escritura, o disco vólvese vermello e non se pode rexeitar. Os compoñentes que superaron as probas están empaquetados para o seu posterior uso.

Como se fai o hardware ruso para o sistema de almacenamento Aerodisk Vostok en Elbrus

Conclusión

Hai un mito que é apoiado activamente por varias figuras de que "en Rusia non saben como facer nada máis que bombear petróleo". Desafortunadamente, este mito come nas cabezas incluso de persoas respectadas e intelixentes.

Recentemente pasoulle unha historia notable a un compañeiro meu. Conducía desde unha das pantallas do sistema de almacenamento Vostok e este sistema de almacenamento estaba deitado no maleteiro do seu coche (non o E124, por suposto, é máis sinxelo). No camiño, capturou a un dos representantes do cliente (unha persoa moi importante, que traballa nun alto cargo nunha das axencias gobernamentais), e no coche mantiveron aproximadamente a seguinte conversa:

O meu compañeiro: "Acabamos de mostrar o sistema de almacenamento en Elbrus, os resultados foron bos, todos estaban contentos, por certo, este sistema de almacenamento tamén será útil para a súa industria"

Cliente: "Sei que tes sistemas de almacenamento, pero de que tipo de Elbrus estás a falar?"

O meu compañeiro: "Ben... o procesador ruso Elbrus, lanzaron recentemente 8, en termos de rendemento dos sistemas de almacenamento, en consecuencia, fixemos unha nova liña de sistemas de almacenamento, chamada Vostok"

Cliente: “Elbrus é unha montaña! E non digas contos de fadas sobre o procesador ruso na sociedade educada, todo isto faise só para absorber orzamentos, en realidade non hai nada e non pasará nada".

O meu compañeiro: "En termos de? Está ben que este sistema de almacenamento en particular estea no meu maleteiro? Paramos agora mesmo, xa cho mostrarei!"

Cliente: "É bo sufrir con tonterías, sigamos, non hai "sistemas de almacenamento rusos" - isto é basicamente imposible"

Nese momento, a persoa importante non quería saber nada máis de Elbrus. Iso si, despois, cando aclarou a información, admitiu que se equivocaba, pero aínda así, ata o final, non cría na veracidade desta información.

De feito, despois do colapso da URSS, o noso país parou realmente no desenvolvemento da produción de microelectrónica. Algo foi exportado e roubado en beneficio das corporacións transnacionais, algo foi roubado pola empresa local de privatizacións, algo, por suposto, foi investido, pero sobre todo en beneficio das mesmas corporacións transnacionais. A árbore foi cortada, pero a raíz quedou.

Despois de case 30 anos de ilusións sobre o tema "Occidente axudaranos", volveuse obvio para case todos que só podemos axudarnos a nós mesmos, polo que necesitamos restaurar a nosa produción non só no campo da microelectrónica, senón en todas as industrias. .

Nestes momentos, no contexto dunha pandemia global nunha situación na que as cadeas de produción transnacionais se pararon, xa está quedando claro que a restauración da produción local xa non é o desenvolvemento dos orzamentos, senón unha condición para a supervivencia de Rusia como un estado independente.

Polo tanto, seguiremos buscando e empregando equipos rusos na vida e contarémosche o que realmente fan as nosas empresas, os problemas aos que se enfrontan e os esforzos titánicos que fan para resolvelos.

É bastante difícil falar de todos os aspectos da produción nun mesmo artigo, polo que, como extra, organizaremos unha discusión en liña en formato webinar sobre este tema. Neste seminario web, falaremos en detalle e con cores vivas sobre os aspectos técnicos da produción das plataformas Yakhont para os sistemas de almacenamento Vostok e responderemos todas as preguntas, incluso as máis complicadas, en liña.

O noso interlocutor será un representante do desenvolvedor da plataforma, a empresa NORSI-TRANS. O webinar terá lugar o 05.06.2020/XNUMX/XNUMX; os que desexen participar poden inscribirse a través da ligazón: https://aerodisk.promo/webinarnorsi/ .

Grazas a todos, coma sempre, agardamos comentarios construtivos.

Fonte: www.habr.com

Engadir un comentario