Huawei Dorado V6: calor de Sichuan

Huawei Dorado V6: calor de Sichuan
O verán en Moscova este ano foi, sinceramente, non moi bo. Comezou moi cedo e rápido, non todos tiveron tempo de reaccionar ante el, e rematou xa a finais de xuño. Por iso, cando Huawei me invitou a ir a China, á cidade de Chengdu, onde se atopa o seu centro RnD, despois de mirar a previsión meteorolóxica de +34 graos á sombra, aceptei inmediatamente. Despois, xa non teño a mesma idade e teño que quentar un pouco os ósos. Pero gustaríame sinalar que foi posible quentar non só os ósos, senón tamén o interior, porque a provincia de Sichuan, na que realmente se atopa Chengdu, é famosa polo seu amor pola comida picante. Pero aínda así, este non é un blog sobre viaxes, así que volvamos ao obxectivo principal da nosa viaxe: unha nova liña de sistemas de almacenamento: Huawei Dorado V6. Este artigo vai desviar un pouco do pasado, porque... foi escrito antes do anuncio oficial, pero publicado só despois do lanzamento. E así, hoxe analizaremos máis de cerca todo o interesante e saboroso que Huawei nos preparou.

Huawei Dorado V6: calor de Sichuan
Haberá 5 modelos na nova liña. Todos os modelos excepto 3000V6 pódense ter en dúas versións: SAS e NVMe. A elección determina a interface dos discos que pode usar neste sistema, os portos de back-end e o número de unidades de disco que pode instalar no sistema. Para NVMe, utilízanse SSD de tamaño Palm, que son máis delgados que os clásicos SSD SAS de 2.5" e pódense instalar en ata 36 pezas. A nova liña é All Flash e non hai configuracións con discos.

Huawei Dorado V6: calor de Sichuan
Palm NVMe SSD

Na miña opinión, os modelos máis interesantes parecen os Dorado 8000 e 18000. Huawei sitúaos como sistemas de gama alta e, grazas á política de prezos de Huawei, contrasta estes modelos de gama media co segmento da competencia. Son estes modelos nos que me centrarei na miña revisión de hoxe. Notarei de inmediato que, debido ás súas características de deseño, os sistemas de controlador dual junior teñen unha arquitectura lixeiramente diferente, diferente da Dorado 8000 e 18000, polo que non todo o que vou falar hoxe é aplicable aos modelos junior.

Unha das principais características dos novos sistemas foi o uso de varios chips, desenvolvidos internamente, cada un dos cales permite distribuír a carga lóxica do procesador central do controlador e engadir funcionalidades a diferentes compoñentes.
Huawei Dorado V6: calor de Sichuan

O corazón dos novos sistemas son os procesadores Kunpeng 920, desenvolvidos en tecnoloxías ARM e fabricados por Huawei de forma independente. Dependendo do modelo, o número de núcleos, a súa frecuencia e o número de procesadores instalados en cada controlador varían:
Huawei Dorado V6 8000 – 2 CPU, 64 núcleos
Huawei Dorado V6 18000 – 4 CPU, 48 núcleos
Huawei Dorado V6: calor de Sichuan

Huawei desenvolveu este procesador na arquitectura ARM e, que eu saiba, inicialmente planeaba instalalo só nos modelos máis antigos Dorado 8000 e 18000, como xa ocorreu con algúns modelos V5, pero as sancións fixeron axustes nesta idea. Por suposto, ARM tamén falou de negarse a cooperar con Huawei durante a imposición de sancións, pero aquí a situación é diferente que con Intel. Huawei produce estes chips de forma independente e ningunha sanción pode deter este proceso. A ruptura das relacións con ARM só ameaza coa perda de acceso a novos desenvolvementos. En canto ao rendemento, só será posible xulgar despois de realizar probas independentes. Aínda que vin como se eliminou 18000M IOPS do sistema Dorado 1 sen ningún problema, ata que o repita coas miñas propias mans no meu rack, non o vou crer. Pero realmente hai moito poder nos controladores. Os modelos máis antigos están equipados con 4 controladores, cada un con 4 procesadores, o que dá un total de 768 núcleos.
Huawei Dorado V6: calor de Sichuan

Pero falarei dos núcleos aínda máis tarde, cando vexamos a arquitectura dos novos sistemas, pero de momento volvamos a outro chip instalado no sistema. O chip parece unha solución moi interesante Ascenso 310 (Polo que eu entendo, o irmán menor do Ascend 910, que se presentou recentemente ao público). A súa tarefa é analizar os bloques de datos que entran no sistema para aumentar o índice de acertos de lectura. É difícil dicir como funcionará no traballo, porque... Hoxe só funciona segundo un modelo determinado e non ten a capacidade de aprender nun modo intelixente. Prométese a aparición dun modo intelixente no firmware futuro, probablemente a principios do próximo ano.

Pasemos á arquitectura. Huawei continuou desenvolvendo a súa propia tecnoloxía Smart Matrix, que implementa un enfoque de malla completa para conectar compoñentes. Pero se na V5 isto era só para o acceso dos controladores aos discos, agora todos os controladores teñen acceso a todos os portos tanto no back-end como no front-end.
Huawei Dorado V6: calor de Sichuan

Grazas á nova arquitectura de microservizos, isto tamén permite o equilibrio de carga entre todos os controladores, aínda que só haxa un lun. O SO para esta liña de matrices foi desenvolvido desde cero, e non simplemente optimizado para o uso de unidades flash. Debido ao feito de que todos os nosos controladores teñen acceso aos mesmos portos, en caso de fallo ou reinicio do controlador, o host non perde unha única ruta ao sistema de almacenamento e a conmutación de ruta realízase a nivel do sistema de almacenamento. Non obstante, usar UltraPath no host non é estrictamente necesario. Outro "aforro" ao instalar o sistema é o menor número de ligazóns necesarias. E se co enfoque "clásico" para controladores 4 necesitaremos 8 ligazóns de 2 fábricas, entón no caso de Huawei incluso 2 será suficiente (non falo agora da suficiencia do rendemento dunha ligazón).
Huawei Dorado V6: calor de Sichuan

Como na versión anterior, utilízase unha caché global con espello. Isto permítelle perder ata dous controladores á vez ou tres controladores secuencialmente sen afectar á dispoñibilidade. Pero vale a pena sinalar que non vimos un equilibrio de carga completo entre os 3 controladores restantes en caso de producirse un fallo no stand de demostración. A carga do controlador fallido foi asumida por completo por un dos restantes. É posible que para iso sexa necesario deixar que o sistema funcione máis tempo nesta configuración. En calquera caso, comprobarei isto con máis detalle mediante as miñas propias probas.
Huawei está a posicionar os novos sistemas como sistemas NVMe de extremo a extremo, pero hoxe en día NVMeOF aínda non é compatible na parte frontal, só FC, iSCSI ou NFS. Ao final deste ou ao comezo do seguinte, como outras funcións, prometéronnos apoio RoCE.
Huawei Dorado V6: calor de Sichuan

Os estantes tamén están conectados aos controladores mediante RoCE, e hai un inconveniente asociado a isto: a ausencia dunha conexión "loopback" dos andeis, como foi o caso de SAS. Na miña opinión, este aínda é un inconveniente bastante grande se está a planear un sistema bastante grande. O caso é que todos os andeis están conectados en serie, e a falla dun dos andeis provoca a completa inaccesibilidade de todos os demais que o seguen. Neste caso, para garantir a tolerancia a fallos, teremos que conectar todos os estantes aos controladores, o que implica un aumento do número necesario de portos backend no sistema.

E unha cousa máis que vale a pena mencionar é a actualización non disruptiva (NDU). Como dixen anteriormente, Huawei implementou un enfoque de contedores para operar o sistema operativo para a nova liña Dorado, isto permítelle actualizar e reiniciar os servizos sen necesidade de reiniciar completamente o controlador. Paga a pena mencionar de inmediato que algunhas actualizacións conterán actualizacións do núcleo e, neste caso, ás veces aínda será necesario un reinicio clásico dos controladores durante a actualización, pero non sempre. Isto reducirase o impacto desta operación no sistema produtivo.

No noso arsenal, a gran maioría das matrices son de NetApp. Polo tanto, creo que será bastante lóxico que fago unha pequena comparación con sistemas cos que teño que traballar bastante. Este non é un intento de determinar quen é mellor e quen é peor ou quen arquitectura é máis vantaxosa. Tentarei comparar con sobriedade e sen fanatismo dous enfoques diferentes para resolver o mesmo problema de distintos provedores. Si, por suposto, neste caso consideraremos os sistemas Huawei en "teoría" e tamén notarei por separado aqueles puntos que está previsto que se implementen en futuras versións de firmware. Que vantaxes vexo neste momento:

  1. Número de unidades NVMe compatibles. NetApp ten actualmente 288 deles, mentres que Huawei ten 1600-6400, dependendo do modelo. Ao mesmo tempo, a capacidade útil máxima de Huawei é de 32 PBe, igual que os sistemas NetApp (para ser máis precisos, teñen 31.64 PBe). E iso a pesar de que se admiten unidades do mesmo volume (ata 15 Tb). Huawei explica este feito do seguinte xeito: non tiveron a oportunidade de montar un stand máis grande. En teoría, non teñen limitación de volume, pero simplemente aínda non puideron probar este feito. Pero aquí vale a pena sinalar que as capacidades das unidades flash hoxe en día son moi altas e, no caso dos sistemas NVMe, estamos ante o feito de que 24 unidades son suficientes para utilizar un sistema de 2 controladores de gama alta. En consecuencia, un novo aumento no número de discos no sistema non só non proporcionará un aumento do rendemento, senón que tamén terá un efecto negativo na relación IOPS/Tb. Por suposto, paga a pena ver cantas unidades poden manexar os sistemas de 4 controladores 8000 e 16000, porque... As capacidades e o potencial do Kunpeng 920 aínda non están completamente claros.
  2. A presenza de Lun como propietario dos sistemas NetApp. Eses. Só un controlador pode realizar operacións coa lúa, mentres que o segundo só pasa IO por si mesmo. Os sistemas Huawei, pola contra, non teñen ningún propietario e as operacións con bloques de datos (compresión, deduplicación) pódense realizar por calquera dos controladores, así como escribir en discos.
  3. Ningún porto cae cando falla un dos controladores. Para algúns, este momento parece extremadamente crítico. A conclusión é que o cambio dentro do sistema de almacenamento debería ocorrer máis rápido que no host. E se no caso da mesma NetApp, na práctica atopamos unha conxelación duns 5 segundos ao sacar o controlador e cambiar de camiño, entón ao cambiar a Huawei aínda temos que practicar.
  4. Non é necesario reiniciar o controlador ao actualizar. Isto empezou a preocuparme especialmente co lanzamento bastante frecuente de novas versións e ramas de firmware para NetApps. Si, algunhas actualizacións de Huawei aínda requirirán un reinicio, pero non todas.
  5. 4 controladores Huawei polo prezo de dous controladores NetApp. Como dixen anteriormente, grazas á política de prezos de Huawei, pode competir coa gama media cos seus modelos de gama alta.
  6. A presenza de chips adicionais en controladores de andel e tarxetas de porto, que potencialmente están destinados a mellorar a eficiencia do sistema.

Contras e preocupacións en xeral:

  1. Conexión directa de estantes aos controladores ou a necesidade dunha gran cantidade de portos de fondo para conectar todos os estantes aos controladores.
  2. A arquitectura ARM e a presenza dunha gran cantidade de chips: con que eficiencia funcionará e o rendemento será suficiente?

A maioría das preocupacións e medos pódense disipar mediante probas persoais da nova liña. Espero que pronto despois do lanzamento aparezan en Moscova e haxa suficientes para conseguir rapidamente un para as súas propias probas. Ata agora, podemos dicir que, en xeral, o enfoque da empresa parece interesante e a nova liña ten un aspecto moi bo en comparación cos seus competidores. A implementación final suscita moitas preguntas, porque Veremos moitas cousas só a finais de ano, e quizais só en 2020.

Fonte: www.habr.com

Engadir un comentario