Ujian NVIDIA A100 (Ampere) pertama mendedahkan prestasi rekod dalam pemaparan 3D menggunakan CUDA

Pada masa ini, NVIDIA telah memperkenalkan hanya satu pemproses grafik Ampere generasi baharu - GA100 perdana, yang menjadi asas kepada pemecut pengkomputeran NVIDIA A100. Dan kini ketua OTOY, sebuah syarikat yang pakar dalam pemaparan awan, telah berkongsi keputusan ujian pertama pemecut ini.

Ujian NVIDIA A100 (Ampere) pertama mendedahkan prestasi rekod dalam pemaparan 3D menggunakan CUDA

Pemproses grafik Ampere GA100 yang digunakan dalam NVIDIA A100 termasuk 6912 teras CUDA dan 40 GB HBM2 RAM. GPU itu sendiri dibuat menggunakan teknologi proses 7-nm di kemudahan TSMC. Pemecut pengkomputeran tersedia dalam versi dengan antara muka PCIe 4.0 dan SXM4. Pada mulanya, pemecut NVIDIA A100 tersedia sebagai sebahagian daripada sistem pengkomputeran NVIDIA DGX A100 proprietari, yang merangkumi sehingga lapan GPU.

Ujian NVIDIA A100 (Ampere) pertama mendedahkan prestasi rekod dalam pemaparan 3D menggunakan CUDA

Pemecut pengkomputeran NVIDIA A100 telah diuji dalam penanda aras OctaneBench yang tidak begitu popular, yang menguji prestasi GPU apabila membuat persembahan menggunakan enjin grafik Octane Render. Ia bergantung pada teknologi NVIDIA CUDA, bermakna ia hanya boleh membuat menggunakan GPU NVIDIA. Dan syarikat yang disebutkan OTOY sedang membangunkan enjin ini.

Ujian NVIDIA A100 (Ampere) pertama mendedahkan prestasi rekod dalam pemaparan 3D menggunakan CUDA

Dilaporkan bahawa pemecut NVIDIA A100 menunjukkan keputusan rekod dalam OctaneBench, yang berjumlah 446 mata. Sebagai perbandingan, NVIDIA Titan V berasaskan Volta mendapat 401 mata (11% lebih rendah), manakala kad grafik Turing-gen terpantas, Quadro RTX 8000, hanya mendapat 328 mata (43% lebih rendah).

Oleh itu, prestasi teori tinggi pemproses Ampere sebenarnya diterjemahkan ke dalam kelajuan pemaparan yang lebih pantas. Biar kami mengingatkan anda bahawa prestasi puncak NVIDIA A100 ialah 19,5 dan 9,7 Tflops pada ketepatan tunggal dan berganda, masing-masing. Pada masa yang sama, generasi Turing Quadro RTX 8000 yang disebutkan di atas hanya boleh menawarkan kelajuan 16,0 dan 0,5 Tflops.

Sumber:



Sumber: 3dnews.ru

Tambah komen