Pierwszy test NVIDIA A100 (Ampere) ujawnia rekordową wydajność renderowania 3D przy użyciu CUDA

W tej chwili NVIDIA wprowadziła tylko jeden procesor graficzny Ampere nowej generacji - flagowy GA100, który stał się podstawą akceleratora obliczeniowego NVIDIA A100. I teraz szef OTOY, firmy specjalizującej się w renderowaniu w chmurze, podzielił się pierwszymi wynikami testów tego akceleratora.

Pierwszy test NVIDIA A100 (Ampere) ujawnia rekordową wydajność renderowania 3D przy użyciu CUDA

Zastosowany w NVIDIA A100 procesor graficzny Ampere GA100 zawiera 6912 rdzeni CUDA i 40 GB pamięci RAM HBM2. Sam procesor graficzny jest wytwarzany w procesie technologicznym 7 nm w zakładach TSMC. Akcelerator obliczeniowy dostępny jest w wersjach z interfejsami PCIe 4.0 i SXM4. Na początku akceleratory NVIDIA A100 dostępne są w ramach autorskich systemów obliczeniowych NVIDIA DGX A100, które obejmują aż osiem procesorów graficznych.

Pierwszy test NVIDIA A100 (Ampere) ujawnia rekordową wydajność renderowania 3D przy użyciu CUDA

Akcelerator obliczeniowy NVIDIA A100 został przetestowany w mało popularnym benchmarku OctaneBench, który sprawdza wydajność procesora graficznego podczas renderowania z wykorzystaniem silnika graficznego Octane Render. Opiera się na technologiach NVIDIA CUDA, co oznacza, że ​​może renderować tylko przy użyciu procesorów graficznych NVIDIA. A wspomniana firma OTOY opracowuje ten silnik.

Pierwszy test NVIDIA A100 (Ampere) ujawnia rekordową wydajność renderowania 3D przy użyciu CUDA

Podaje się, że akcelerator NVIDIA A100 osiągnął rekordowy wynik w OctaneBench, który wyniósł 446 punktów. Dla porównania, karta graficzna NVIDIA Titan V z procesorem Volta uzyskała 401 punktów (11% mniej), podczas gdy najszybsza karta graficzna generacji Turing, Quadro RTX 8000, uzyskała zaledwie 328 punktów (43% mniej).

Zatem wysoka teoretyczna wydajność procesora Ampere faktycznie przekłada się na większą prędkość renderowania. Przypomnijmy, że szczytowa wydajność NVIDIA A100 wynosi odpowiednio 19,5 i 9,7 Tflops przy pojedynczej i podwójnej precyzji. Jednocześnie wspomniana wyżej generacja Turinga Quadro RTX 8000 może oferować jedynie prędkości 16,0 i 0,5 Tflops.

Źródło:



Źródło: 3dnews.ru

Dodaj komentarz