Huawei Dorado V6: el calor de Sichuan

Huawei Dorado V6: el calor de Sichuan
El verano en Moscú este año, para ser honesto, no fue muy bueno. Comenzó demasiado pronto y rápidamente, no todos tuvieron tiempo de reaccionar y terminó ya a finales de junio. Por lo tanto, cuando Huawei me invitó a ir a China, a la ciudad de Chengdu, donde se encuentra su centro de I+D, después de mirar el pronóstico del tiempo de +34 grados a la sombra, acepté de inmediato. Después de todo, ya no tengo la misma edad y necesito calentar un poco mis huesos. Pero me gustaría señalar que fue posible calentar no solo los huesos, sino también el interior, porque la provincia de Sichuan, en la que realmente se encuentra Chengdu, es famosa por su amor a la comida picante. Pero aún así, este no es un blog sobre viajes, así que volvamos al objetivo principal de nuestro viaje: una nueva línea de sistemas de almacenamiento: Huawei Dorado V6. Este artículo te sacará un poco del pasado, porque... fue escrito antes del anuncio oficial, pero publicado solo después del lanzamiento. Por eso, hoy veremos más de cerca todo lo interesante y sabroso que Huawei nos ha preparado.

Huawei Dorado V6: el calor de Sichuan
Habrá 5 modelos en la nueva línea. Todos los modelos, excepto el 3000V6, se pueden adquirir en dos versiones: SAS y NVMe. La elección determina la interfaz de los discos que puede usar en este sistema, los puertos Back-End y la cantidad de unidades de disco que puede instalar en el sistema. Para NVMe, se utilizan SSD del tamaño de la palma de la mano, que son más delgados que los SSD SAS clásicos de 2.5" y se pueden instalar en hasta 36 piezas. La nueva línea es All Flash y no hay configuraciones con discos.

Huawei Dorado V6: el calor de Sichuan
SSD NVMe de palma

En mi opinión, los modelos más interesantes son los Dorado 8000 y 18000. Huawei los posiciona como sistemas de gama alta y, gracias a la política de precios de Huawei, contrasta estos modelos de gama media con el segmento de la competencia. Son estos modelos en los que me centraré en mi revisión de hoy. Notaré de inmediato que, debido a sus características de diseño, los sistemas junior de doble controlador tienen una arquitectura ligeramente diferente, diferente de Dorado 8000 y 18000, por lo que no todo de lo que hablaré hoy es aplicable a los modelos junior.

Una de las principales características de los nuevos sistemas fue el uso de varios chips desarrollados internamente, cada uno de los cuales permite distribuir la carga lógica desde el procesador central del controlador y agregar funcionalidad a diferentes componentes.
Huawei Dorado V6: el calor de Sichuan

El corazón de los nuevos sistemas son los procesadores Kunpeng 920, desarrollados con tecnologías ARM y fabricados por Huawei de forma independiente. Dependiendo del modelo, la cantidad de núcleos, su frecuencia y la cantidad de procesadores instalados en cada controlador varían:
Huawei Dorado V6 8000 – 2 CPU, 64 núcleos
Huawei Dorado V6 18000 – 4 CPU, 48 núcleos
Huawei Dorado V6: el calor de Sichuan

Huawei desarrolló este procesador en la arquitectura ARM y, hasta donde yo sé, inicialmente planeó instalarlo solo en los modelos más antiguos Dorado 8000 y 18000, como ya era el caso con algunos modelos V5, pero las sanciones hicieron ajustes a esta idea. Por supuesto, ARM también habló de negarse a cooperar con Huawei durante la imposición de sanciones, pero aquí la situación es diferente que con Intel. Huawei produce estos chips de forma independiente y ninguna sanción puede detener este proceso. Romper las relaciones con ARM sólo amenaza con perder el acceso a nuevos desarrollos. En cuanto al rendimiento, será posible juzgar sólo después de realizar pruebas independientes. Aunque vi cómo se eliminó 18000M IOPS del sistema Dorado 1 sin ningún problema, hasta que lo repita con mis propias manos en mi rack no lo creeré. Pero realmente hay mucho poder en los controladores. Los modelos más antiguos están equipados con 4 controladores, cada uno con 4 procesadores, lo que da un total de 768 núcleos.
Huawei Dorado V6: el calor de Sichuan

Pero hablaré de los núcleos incluso más adelante, cuando veamos la arquitectura de los nuevos sistemas, pero por ahora volvamos a otro chip instalado en el sistema. El chip parece una solución extremadamente interesante. Ascender 310 (Por lo que tengo entendido, el hermano menor del Ascend 910, que se presentó recientemente al público). Su tarea es analizar los bloques de datos que ingresan al sistema para aumentar la tasa de aciertos de lectura. Es difícil decir cómo funcionará en el trabajo, porque... Hoy en día solo funciona según una plantilla determinada y no tiene la capacidad de aprender en modo inteligente. La aparición de un modo inteligente se promete en futuros firmware, probablemente a principios del próximo año.

Pasemos a la arquitectura. Huawei ha seguido desarrollando su propia tecnología Smart Matrix, que implementa un enfoque de malla completa para conectar componentes. Pero si en V5 esto era solo para acceso desde controladores a discos, ahora todos los controladores tienen acceso a todos los puertos tanto en el Back-End como en el Front-End.
Huawei Dorado V6: el calor de Sichuan

Gracias a la nueva arquitectura de microservicio, esto también permite el equilibrio de carga entre todos los controladores, incluso si solo hay un lun. El sistema operativo para esta línea de matrices se desarrolló desde cero y no simplemente se optimizó para el uso de unidades flash. Debido al hecho de que todos nuestros controladores tienen acceso a los mismos puertos, en caso de falla del controlador o reinicio, el host no pierde una sola ruta al sistema de almacenamiento y el cambio de ruta se realiza a nivel del sistema de almacenamiento. Sin embargo, no es estrictamente necesario utilizar UltraPath en el host. Otro “ahorro” a la hora de instalar el sistema es el menor número de enlaces necesarios. Y si con el enfoque "clásico" para 4 controladores necesitaremos 8 enlaces de 2 fábricas, entonces en el caso de Huawei incluso 2 serán suficientes (no me refiero ahora a la suficiencia del rendimiento de un enlace).
Huawei Dorado V6: el calor de Sichuan

Como en la versión anterior, se utiliza un caché global con duplicación. Esto le permite perder hasta dos controladores simultáneamente o tres controladores secuencialmente sin afectar la disponibilidad. Pero vale la pena señalar que no vimos un equilibrio de carga completo entre los 3 controladores restantes en caso de una falla en el stand de demostración. La carga del controlador averiado fue asumida completamente por uno de los restantes. Es posible que para ello sea necesario dejar que el sistema funcione más tiempo en esta configuración. En cualquier caso, lo comprobaré con más detalle mediante mis propias pruebas.
Huawei está posicionando los nuevos sistemas como sistemas NVMe de extremo a extremo, pero hoy en día NVMeOF aún no es compatible con el front-end, solo FC, iSCSI o NFS. Al final de esta o principios de la siguiente, al igual que otras funciones, se nos promete soporte RoCE.
Huawei Dorado V6: el calor de Sichuan

Los estantes también están conectados a los controladores mediante RoCE, y esto tiene un inconveniente: la ausencia de una conexión de "bucle invertido" de los estantes, como era el caso con SAS. En mi opinión, esto sigue siendo un gran inconveniente si se planea un sistema bastante grande. El hecho es que todos los estantes están conectados en serie, y el fallo de uno de los estantes provoca la total inaccesibilidad de todos los demás que lo siguen. En este caso, para garantizar la tolerancia a fallas, tendremos que conectar todos los estantes a los controladores, lo que implica un aumento en la cantidad requerida de puertos backend en el sistema.

Y una cosa más que vale la pena mencionar es la actualización no disruptiva (NDU). Como dije anteriormente, Huawei ha implementado un enfoque de contenedor para operar el sistema operativo para la nueva línea Dorado, esto le permite actualizar y reiniciar servicios sin la necesidad de reiniciar completamente el controlador. Vale la pena mencionar de inmediato que algunas actualizaciones contendrán actualizaciones del kernel y, en este caso, a veces será necesario reiniciar los controladores durante la actualización, pero no siempre. Esto reducirá el impacto de esta operación en el sistema productivo.

En nuestro arsenal, la gran mayoría de matrices son de NetApp. Por tanto, creo que será bastante lógico si hago una pequeña comparación con sistemas con los que tengo que trabajar bastante. Este no es un intento de determinar quién es mejor y quién es peor o qué arquitectura es más ventajosa. Intentaré comparar con seriedad y sin fanatismo dos enfoques diferentes para resolver el mismo problema de diferentes proveedores. Sí, por supuesto, en este caso consideraremos los sistemas de Huawei en "teoría" y también señalaré por separado aquellos puntos que se planea implementar en futuras versiones de firmware. Qué ventajas veo en este momento:

  1. Número de unidades NVMe compatibles. NetApp tiene actualmente 288 de ellos, mientras que Huawei tiene entre 1600 y 6400, según el modelo. Al mismo tiempo, la capacidad máxima utilizable de Huawei es de 32 PBe, al igual que los sistemas NetApp (para ser más precisos, tienen 31.64 PBe). Y esto a pesar de que se admiten unidades del mismo volumen (hasta 15Tb). Huawei explica este hecho de la siguiente manera: no tuvieron la oportunidad de montar un stand más grande. En teoría, no tienen limitación de volumen, pero simplemente no han podido probar este hecho todavía. Pero vale la pena señalar aquí que las capacidades de las unidades flash hoy en día son muy altas y, en el caso de los sistemas NVMe, nos enfrentamos al hecho de que 24 unidades son suficientes para utilizar un sistema de 2 controladores de gama alta. En consecuencia, un mayor aumento en la cantidad de discos en el sistema no solo no proporcionará un aumento en el rendimiento, sino que también tendrá un efecto negativo en la relación IOPS/Tb. Por supuesto, vale la pena ver cuántas unidades pueden manejar los sistemas de 4 controladores 8000 y 16000, porque... Las capacidades y el potencial del Kunpeng 920 aún no están del todo claros.
  2. La presencia de Lun como propietario de los sistemas NetApp. Aquellos. Sólo un controlador puede realizar operaciones con la luna, mientras que el segundo sólo pasa IO a través de sí mismo. Los sistemas Huawei, por el contrario, no tienen propietarios y las operaciones con bloques de datos (compresión, deduplicación) pueden ser realizadas por cualquiera de los controladores, así como escritas en discos.
  3. Ningún puerto se cae cuando falla uno de los controladores. Para algunos, este momento parece extremadamente crítico. La conclusión es que la conmutación dentro del sistema de almacenamiento debería ocurrir más rápido que en el lado del host. Y si en el caso del mismo NetApp, en la práctica encontramos una congelación de unos 5 segundos al sacar el controlador y cambiar de ruta, entonces con el cambio a Huawei todavía tenemos que practicar.
  4. No es necesario reiniciar el controlador al actualizar. Esto empezó a preocuparme especialmente con el lanzamiento bastante frecuente de nuevas versiones y ramas de firmware para NetApps. Sí, algunas actualizaciones para Huawei aún requerirán un reinicio, pero no todas.
  5. 4 controladores Huawei por el precio de dos controladores NetApp. Como decía más arriba, gracias a la política de precios de Huawei, puede competir con la gama media con sus modelos de gama alta.
  6. La presencia de chips adicionales en controladores de estantería y tarjetas de puerto, que potencialmente están destinados a mejorar la eficiencia del sistema.

Contras y preocupaciones en general:

  1. Conexión directa de estantes a controladores o la necesidad de una gran cantidad de puertos back-end para conectar todos los estantes a los controladores.
  2. Arquitectura ARM y presencia de una gran cantidad de chips: ¿con qué eficiencia funcionará y el rendimiento será suficiente?

La mayoría de las preocupaciones y temores pueden disiparse probando personalmente la nueva línea. Espero que poco después del lanzamiento aparezcan en Moscú y haya suficientes para obtener rápidamente uno para sus propias pruebas. Hasta ahora podemos decir que, en general, el enfoque de la empresa parece interesante y la nueva línea parece muy buena en comparación con sus competidores. La implementación final plantea muchas preguntas, porque Veremos muchas cosas recién a finales de año, y tal vez recién en 2020.

Fuente: habr.com

Añadir un comentario