NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

El sistema DGX A100, basado en el cual Jen-Hsun Huang recientemente lo saqué del horno, incluye ocho GPU A100, seis conmutadores NVLink 3.0, nueve controladores de red Mellanox, dos procesadores AMD EPYC de generación Rome con 64 núcleos, 1 TB de RAM y 15 TB de SSD con soporte NVMe.

NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

NVIDIA DGX A100 es la tercera generación de los sistemas informáticos de la empresa, diseñada principalmente para resolver problemas de inteligencia artificial. Ahora estos sistemas se basan en los últimos procesadores gráficos A100 de la familia Ampere, lo que provoca un fuerte aumento en su rendimiento, que ha alcanzado los 5 petaflops. Gracias a esto, el DGX A100 es capaz de manejar modelos de IA mucho más complejos y volúmenes de datos mucho mayores.

Para el sistema DGX A100, NVIDIA indica solo la cantidad total de memoria HBM2, que alcanza los 320 GB. Simples cálculos aritméticos nos permiten determinar que cada GPU tiene 40 GB de memoria, y las imágenes del nuevo producto dejan claro que este volumen se distribuye entre seis pilas. También se menciona el ancho de banda de la memoria gráfica: 12,4 TB/s para todo el sistema DGX A100 en total.

Teniendo en cuenta que el sistema DGX-1, basado en ocho Tesla V100, produjo un petaflops en cálculos de precisión mixta, y se afirma que el DGX A100 funciona a cinco petaflops, podemos suponer que en cálculos específicos una GPU Ampere es cinco veces más rápida que su predecesor con arquitectura Volta. En algunos casos, la ventaja llega a ser veinte veces mayor.

NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

En total, el sistema DGX A8 proporciona un rendimiento máximo de 100 operaciones por segundo en operaciones de número entero (INT1016), en operaciones de punto flotante de media precisión (FP16) - 5 petaflops, en operaciones de punto flotante de doble precisión (FP64) - 156 teraflops . Además, el DGX A32 alcanza un rendimiento máximo de 100 petaflops en computación tensor TF2,5. Recordemos que un teraflops son 1012 operaciones en coma flotante por segundo, un petaflops son 1015 operaciones en coma flotante por segundo.

Una característica importante de los aceleradores NVIDIA A100 es la capacidad de dividir los recursos de una GPU en siete segmentos virtuales. Esto le permite aumentar significativamente la flexibilidad de configuración en el mismo segmento de la nube. Por ejemplo, un sistema DGX A100 con ocho GPU físicas puede actuar como 56 GPU virtuales. La tecnología GPU de instancias múltiples (MIG) le permite seleccionar segmentos de diferentes tamaños tanto entre los núcleos informáticos como como parte de la memoria caché y la memoria HBM2, y no competirán entre sí por el ancho de banda.

NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

Vale la pena señalar que, en comparación con los sistemas DGX anteriores, la anatomía del DGX A100 ha sufrido algunos cambios. El número de heatpipes en los radiadores de los módulos SXM3, en los que están instalados los procesadores gráficos A100 con memoria HBM2, ha aumentado significativamente en comparación con los módulos Tesla V100 de la generación Volta, aunque sus extremos están ocultos a la vista del ciudadano medio. por las cubiertas superiores. El límite práctico para este diseño es 400 W de energía térmica. Así lo confirman también las características oficiales del A100 en la versión SXM3, publicadas hoy.

Junto a las GPU A100 en la placa base hay seis conmutadores de interfaz NVLink de tercera generación, que juntos proporcionan intercambio de datos bidireccional a una velocidad de 4,8 TB/s. NVIDIA también cuidó seriamente su refrigeración, a juzgar por los radiadores de perfil completo con tubos de calor. A cada GPU se le asignan 12 canales de la interfaz NVLink; las GPU vecinas pueden intercambiar datos a una velocidad de 600 GB/s.

El sistema DGX A100 también alberga nueve controladores de red Mellanox ConnectX-6 HDR, capaces de transmitir información a velocidades de hasta 200 Gbit/s. En total, el DGX A100 proporciona transferencia de datos bidireccional a una velocidad de 3,6 TB/s. El sistema también utiliza tecnologías patentadas de Mellanox destinadas a escalar eficientemente los sistemas informáticos con dicha arquitectura. La compatibilidad con PCI Express 4.0 a nivel de plataforma está determinada por los procesadores AMD EPYC de generación Roma; como resultado, esta interfaz es utilizada no solo por los aceleradores de gráficos A100, sino también por las unidades de estado sólido con el protocolo NVMe.

NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

Además de la DGX A100, NVIDIA ha comenzado a suministrar a sus socios placas HGX A100, que son uno de los componentes de los sistemas de servidores que otros fabricantes producirán por su cuenta. Una sola placa HGX A100 puede acomodar cuatro u ocho GPU NVIDIA A100. Además, para sus propias necesidades, NVIDIA ya ha ensamblado DGX SuperPOD, un grupo de 140 sistemas DGX A100 que proporcionan un rendimiento de 700 petaflops con dimensiones generales bastante modestas. La compañía se comprometió a brindar asistencia metodológica a los socios que deseen construir clústeres informáticos similares basados ​​en el DGX A100. Por cierto, a NVIDIA no le llevó más de un mes construir el DGX SuperPOD en lugar de varios meses o incluso años, como es habitual para este tipo de tareas.

NVIDIA DGX A100: la primera plataforma basada en Ampere ofrece cinco petaflops de rendimiento

Según NVIDIA, las entregas del DGX A100 ya han comenzado a un precio de 199 dólares por copia, los socios de la compañía ya están alojando estos sistemas en sus clústeres de nube, el ecosistema ya cubre 000 países, incluidos Vietnam y los Emiratos Árabes Unidos. Además, es bastante probable que las soluciones gráficas con arquitectura Ampere formen parte del sistema de supercomputadora Perlmutter, creado por Cray para el Departamento de Energía de Estados Unidos. Estará compuesto por procesadores gráficos NVIDIA Ampere junto a procesadores centrales AMD EPYC de generación Milán con arquitectura Zen 26. Los nodos de superordenador basados ​​en NVIDIA Ampere llegarán al cliente en la segunda mitad del año, aunque los primeros ejemplares ya han llegado al laboratorio especializado de el departamento americano.



Fuente: 3dnews.ru

Añadir un comentario