El primer punt de referència de NVIDIA A100 (Ampere) revela un rendiment de renderització 3D rècord amb CUDA

De moment, NVIDIA només ha presentat un processador gràfic Ampere de nova generació: el vaixell insígnia GA100, que va formar la base de l'accelerador informàtic NVIDIA A100. I ara el responsable d'OTOY, una empresa especialitzada en renderització al núvol, ha compartit els primers resultats de les proves d'aquest accelerador.

El primer punt de referència de NVIDIA A100 (Ampere) revela un rendiment de renderització 3D rècord amb CUDA

El processador gràfic Ampere GA100 utilitzat a la NVIDIA A100 inclou 6912 nuclis CUDA i 40 GB de RAM HBM2. La GPU en si es fa mitjançant una tecnologia de procés de 7 nm a les instal·lacions de TSMC. L'accelerador informàtic està disponible en versions amb interfícies PCIe 4.0 i SXM4. Al principi, els acceleradors NVIDIA A100 estan disponibles com a part dels sistemes informàtics propietaris NVIDIA DGX A100, que inclouen fins a vuit GPU.

El primer punt de referència de NVIDIA A100 (Ampere) revela un rendiment de renderització 3D rècord amb CUDA

L'accelerador de computació NVIDIA A100 es va provar en el benchmark OctaneBench, no tan popular, que prova el rendiment de la GPU quan es renderitza amb el motor gràfic Octane Render. Es basa en les tecnologies NVIDIA CUDA, és a dir, només es pot renderitzar mitjançant GPU NVIDIA. I l'esmentada empresa OTOY està desenvolupant aquest motor.

El primer punt de referència de NVIDIA A100 (Ampere) revela un rendiment de renderització 3D rècord amb CUDA

S'informa que l'accelerador NVIDIA A100 va mostrar un resultat rècord a OctaneBench, que va ascendir a 446 punts. En comparació, la NVIDIA Titan V basada en Volta obté 401 punts (un 11% més baix), mentre que la targeta gràfica més ràpida de Turing-gen, la Quadro RTX 8000, només obté 328 punts (un 43% més baix).

Així, l'alt rendiment teòric del processador Ampere es tradueix realment en velocitats de renderització més ràpides. Recordem que el rendiment màxim de l'NVIDIA A100 és de 19,5 i 9,7 Tflops amb precisió simple i doble, respectivament. Al mateix temps, la generació Turing Quadro RTX 8000 esmentada anteriorment només pot oferir velocitats de 16,0 i 0,5 Tflops.

Font:



Font: 3dnews.ru

Afegeix comentari