NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

O sistema DGX A100, baseado no qual Jen-Hsun Huang recentemente tirei do forno, inclui oito GPUs A100, seis switches NVLink 3.0, nove controladores de rede Mellanox, dois processadores AMD EPYC da geração Rome com 64 núcleos, 1 TB de RAM e 15 TB de SSDs com suporte NVMe.

NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

NVIDIA DGX A100 é a terceira geração de sistemas de computação da empresa, projetada principalmente para resolver problemas de inteligência artificial. Agora, esses sistemas são construídos nos mais recentes processadores gráficos A100 da família Ampere, o que provoca um aumento acentuado em seu desempenho, que atingiu 5 petaflops. Graças a isso, o DGX A100 é capaz de lidar com modelos de IA muito mais complexos e volumes de dados muito maiores.

Para o sistema DGX A100, a NVIDIA indica apenas a quantidade total de memória HBM2, que chega a 320 GB. Cálculos aritméticos simples permitem determinar que cada GPU possui 40 GB de memória, e as imagens do novo produto deixam claro que esse volume está distribuído em seis pilhas. A largura de banda da memória gráfica também é mencionada - 12,4 TB/s para todo o sistema DGX A100 no total.

Considerando que o sistema DGX-1, baseado em oito Tesla V100s, produziu um petaflops em cálculos de precisão mista, e o DGX A100 tem desempenho de cinco petaflops, podemos assumir que em cálculos específicos uma GPU Ampere é cinco vezes mais rápida do que seu antecessor com arquitetura Volta. Em alguns casos, a vantagem chega a ser vinte vezes maior.

NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

No total, o sistema DGX A8 oferece desempenho máximo de 100 operações por segundo em operações inteiras (INT1016), em operações de ponto flutuante de meia precisão (FP16) - 5 petaflops, em operações de ponto flutuante de precisão dupla (FP64) - 156 teraflops . Além disso, o DGX A32 atinge um desempenho máximo de 100 petaflops na computação de tensores TF2,5. Lembremos que um teraflops equivale a 1012 operações de ponto flutuante por segundo, um petaflops equivale a 1015 operações de ponto flutuante por segundo.

Um recurso importante dos aceleradores NVIDIA A100 é a capacidade de dividir os recursos de uma GPU em sete segmentos virtuais. Isso permite aumentar significativamente a flexibilidade de configuração no mesmo segmento de nuvem. Por exemplo, um sistema DGX A100 com oito GPUs físicas pode atuar como 56 GPUs virtuais. A tecnologia Multi-Instância GPU (MIG) permite selecionar segmentos de diferentes tamanhos tanto entre os núcleos de computação quanto como parte da memória cache e memória HBM2, e eles não competirão entre si por largura de banda.

NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

É importante notar que em comparação com os sistemas DGX anteriores, a anatomia do DGX A100 sofreu algumas alterações. O número de tubos de calor nos radiadores dos módulos SXM3, nos quais estão instalados processadores gráficos A100 com memória HBM2, aumentou significativamente em comparação com os módulos Tesla V100 da geração Volta, embora suas extremidades estejam escondidas da vista do cidadão comum pelas tampas superiores. O limite prático para este projeto é de 400 W de energia térmica. Isto também é confirmado pelas características oficiais do A100 na versão SXM3, publicadas hoje.

Ao lado das GPUs A100 na placa-mãe estão seis switches de interface NVLink de terceira geração, que juntos fornecem troca de dados bidirecional a uma velocidade de 4,8 TB/s. A NVIDIA também cuidou muito de seu resfriamento, a julgar pelos radiadores de perfil completo com tubos de calor. Cada GPU recebe 12 canais da interface NVLink; GPUs vizinhas podem trocar dados a uma velocidade de 600 GB/s.

O sistema DGX A100 também abriga nove controladores de rede Mellanox ConnectX-6 HDR, capazes de transmitir informações em velocidades de até 200 Gbit/s. No total, o DGX A100 oferece transferência de dados bidirecional a uma velocidade de 3,6 TB/s. O sistema também utiliza tecnologias proprietárias da Mellanox destinadas ao dimensionamento eficiente de sistemas de computação com tal arquitetura. O suporte PCI Express 4.0 no nível da plataforma é determinado pelos processadores da geração AMD EPYC Rome, como resultado, essa interface é usada não apenas por aceleradores gráficos A100, mas também por unidades de estado sólido com protocolo NVMe.

NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

Além do DGX A100, a NVIDIA começou a fornecer aos seus parceiros placas HGX A100, que são um dos componentes de sistemas de servidores que outros fabricantes produzirão por conta própria. Uma única placa HGX A100 pode acomodar quatro ou oito GPUs NVIDIA A100. Além disso, para suas próprias necessidades, a NVIDIA já montou o DGX SuperPOD - um cluster de 140 sistemas DGX A100 que fornece desempenho de 700 petaflops com dimensões gerais bastante modestas. A empresa prometeu fornecer assistência metodológica aos parceiros que desejam construir clusters computacionais semelhantes baseados no DGX A100. A propósito, a NVIDIA não demorou mais do que um mês para construir o DGX SuperPOD, em vez dos vários meses ou mesmo anos típicos para tais tarefas.

NVIDIA DGX A100: plataforma de estreia baseada em Ampere oferece cinco petaflops de desempenho

Segundo a NVIDIA, as entregas do DGX A100 já começaram ao preço de US$ 199 mil por cópia, os parceiros da empresa já estão hospedando esses sistemas em seus clusters de nuvem, o ecossistema já cobre 000 países, incluindo Vietnã e Emirados Árabes Unidos. Além disso, soluções gráficas com arquitetura Ampere farão parte, de forma bastante previsível, do sistema de supercomputador Perlmutter, criado por Cray para o Departamento de Energia dos EUA. Será composto por processadores gráficos NVIDIA Ampere juntamente com processadores centrais da geração AMD EPYC Milan com arquitetura Zen 26. Os nós de supercomputadores baseados em NVIDIA Ampere chegarão ao cliente no segundo semestre do ano, embora as primeiras cópias já tenham chegado ao laboratório especializado de o departamento americano.



Fonte: 3dnews.ru

Adicionar um comentário