O primeiro benchmark NVIDIA A100 (Ampere) revela desempenho recorde em renderização 3D usando CUDA

No momento, a NVIDIA lançou apenas um processador gráfico Ampere de nova geração - o carro-chefe GA100, que formou a base do acelerador de computação NVIDIA A100. E agora o chefe da OTOY, empresa especializada em renderização em nuvem, compartilhou os primeiros resultados dos testes deste acelerador.

O primeiro benchmark NVIDIA A100 (Ampere) revela desempenho recorde em renderização 3D usando CUDA

O processador gráfico Ampere GA100 usado no NVIDIA A100 inclui 6912 núcleos CUDA e 40 GB de RAM HBM2. A GPU em si é fabricada usando uma tecnologia de processo de 7 nm nas instalações da TSMC. O acelerador de computação está disponível em versões com interfaces PCIe 4.0 e SXM4. A princípio, os aceleradores NVIDIA A100 estão disponíveis como parte dos sistemas de computação proprietários NVIDIA DGX A100, que incluem até oito GPUs.

O primeiro benchmark NVIDIA A100 (Ampere) revela desempenho recorde em renderização 3D usando CUDA

O acelerador de computação NVIDIA A100 foi testado no não tão popular benchmark OctaneBench, que testa o desempenho da GPU ao renderizar usando o mecanismo gráfico Octane Render. Ele depende das tecnologias NVIDIA CUDA, o que significa que só pode renderizar usando GPUs NVIDIA. E a citada empresa OTOY está desenvolvendo esse motor.

O primeiro benchmark NVIDIA A100 (Ampere) revela desempenho recorde em renderização 3D usando CUDA

É relatado que o acelerador NVIDIA A100 apresentou um resultado recorde no OctaneBench, que totalizou 446 pontos. Em comparação, a NVIDIA Titan V baseada em Volta marca 401 pontos (11% menos), enquanto a placa gráfica mais rápida da geração Turing, a Quadro RTX 8000, marca apenas 328 pontos (43% menos).

Assim, o alto desempenho teórico do processador Ampere na verdade se traduz em velocidades de renderização mais rápidas. Lembramos que o desempenho máximo do NVIDIA A100 é de 19,5 e 9,7 Tflops com precisão simples e dupla, respectivamente. Ao mesmo tempo, a Quadro RTX 8000 da geração Turing mencionada acima só pode oferecer velocidades de 16,0 e 0,5 Tflops.

Fonte:



Fonte: 3dnews.ru

Adicionar um comentário