Перший тест NVIDIA A100 (Ampere) виявив рекордну продуктивність у 3D-рендерингу з використанням CUDA

На даний момент NVIDIA представила лише один графічний процесор нового покоління Ampere - флагманський GA100, який ліг в основу прискорювача обчислень NVIDIA A100. І тепер голова компанії OTOY, що спеціалізується на хмарному рендерингу, поділився першими результатами тестів прискорювача.

Перший тест NVIDIA A100 (Ampere) виявив рекордну продуктивність у 3D-рендерингу з використанням CUDA

Використовуваний у NVIDIA A100 графічний процесор Ampere GA100 включає 6912 ядер CUDA і відразу 40 Гбайт оперативної пам'яті HBM2. Сам GPU виконаний із використанням 7-нм техпроцесу на потужностях TSMC. Прискорювач обчислень представлений у версіях з інтерфейсами PCIe 4.0 та SXM4. Спочатку прискорювачі NVIDIA A100 доступні у складі фірмових обчислювальних систем NVIDIA DGX A100, які включають до восьми GPU.

Перший тест NVIDIA A100 (Ampere) виявив рекордну продуктивність у 3D-рендерингу з використанням CUDA

Прискорювач обчислень NVIDIA A100 був протестований у не найпопулярнішому бенчмарку OctaneBench, який перевіряє продуктивність GPU при рендерингу за допомогою графічного двигуна Octane Render. Він покладається на технології NVIDIA CUDA, тобто може рендерувати лише за умови використання графічних процесорів NVIDIA. І згадана компанія OTOY займається розвитком цього двигуна.

Перший тест NVIDIA A100 (Ampere) виявив рекордну продуктивність у 3D-рендерингу з використанням CUDA

Повідомляється, що прискорювач NVIDIA A100 показав рекордний результат у OctaneBench, який становив 446 балів. Для порівняння, NVIDIA Titan V на базі Volta демонструє результат у 401 бал (на 11% нижче), а найшвидша відеокарта покоління Turing – Quadro RTX 8000 – набирає всього 328 балів (відставання на 43%).

Таким чином, висока теоретична продуктивність процесора Ampere дійсно конвертується у вищу швидкість рендерингу. Нагадаємо, пікова продуктивність NVIDIA A100 становить 19,5 і 9,7 Тфлопс при одинарній та подвійній точності відповідно. У той же час згадана вище Quadro RTX 8000 покоління Turing може запропонувати швидкодію лише на рівні 16,0 та 0,5 Тфлопс.

Джерело:



Джерело: 3dnews.ru

Додати коментар або відгук