NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

Hệ thống DGX A100, dựa trên đó Jen-Hsun Huang gần đây lấy nó ra khỏi lò, bao gồm tám GPU A100, sáu bộ chuyển mạch NVLink 3.0, chín bộ điều khiển mạng Mellanox, hai bộ xử lý AMD EPYC thế hệ Rome với 64 lõi, RAM 1 TB và ổ SSD 15 TB có hỗ trợ NVMe.

NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

NVIDIA DGX A100 là thế hệ thứ ba trong hệ thống máy tính của công ty, được thiết kế chủ yếu để giải quyết các vấn đề về trí tuệ nhân tạo. Giờ đây, những hệ thống như vậy được xây dựng trên bộ xử lý đồ họa A100 mới nhất của dòng Ampere, điều này khiến hiệu suất của chúng tăng mạnh, đạt tới 5 petaflop. Nhờ đó, DGX A100 có thể xử lý các mô hình AI phức tạp hơn nhiều và khối lượng dữ liệu lớn hơn nhiều.

Đối với hệ thống DGX A100, NVIDIA chỉ cho biết tổng dung lượng bộ nhớ HBM2 đạt 320 GB. Các phép tính số học đơn giản cho phép chúng tôi xác định rằng mỗi GPU có 40 GB bộ nhớ và hình ảnh của sản phẩm mới cho thấy rõ rằng ổ đĩa này được phân bổ giữa sáu ngăn xếp. Băng thông bộ nhớ đồ họa cũng được đề cập - tổng cộng 12,4 TB / s cho toàn bộ hệ thống DGX A100.

Xem xét rằng hệ thống DGX-1, dựa trên tám chiếc Tesla V100, đã tạo ra một petaflop trong các phép tính có độ chính xác hỗn hợp và DGX A100 được cho là hoạt động ở mức XNUMX petaflop, chúng ta có thể giả định rằng trong các tính toán cụ thể, một GPU Ampere nhanh hơn năm lần so với tiền thân của nó với kiến ​​trúc Volta. Trong một số trường hợp, lợi thế tăng gấp đôi.

NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

Tổng cộng, hệ thống DGX A8 cung cấp hiệu suất cao nhất là 100 thao tác mỗi giây trong các phép toán số nguyên (INT1016), trong các phép toán dấu phẩy động có độ chính xác một nửa (FP16) - 5 petaflop, trong các phép toán dấu phẩy động có độ chính xác kép (FP64) - 156 teraflop . Ngoài ra, DGX A32 đạt được hiệu suất cao nhất là 100 petaflop trong tính toán tensor TF2,5. Chúng ta hãy nhớ lại rằng một teraflop là 1012 phép toán dấu phẩy động mỗi giây, một petaflop là 1015 phép toán dấu phẩy động mỗi giây.

Một tính năng quan trọng của bộ tăng tốc NVIDIA A100 là khả năng chia tài nguyên của một GPU thành bảy phân đoạn ảo. Điều này cho phép bạn tăng đáng kể tính linh hoạt của cấu hình trong cùng phân khúc đám mây. Ví dụ: một hệ thống DGX A100 với 56 GPU vật lý có thể hoạt động như 2 GPU ảo. Công nghệ GPU đa phiên bản (MIG) cho phép bạn chọn các phân đoạn có kích thước khác nhau giữa các lõi điện toán và như một phần của bộ nhớ đệm và bộ nhớ HBMXNUMX, đồng thời chúng sẽ không cạnh tranh với nhau về băng thông.

NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

Điều đáng chú ý là so với các hệ thống DGX trước đây, cấu trúc của DGX A100 đã trải qua một số thay đổi. Số lượng ống dẫn nhiệt trong bộ tản nhiệt của mô-đun SXM3, trên đó cài đặt bộ xử lý đồ họa A100 với bộ nhớ HBM2, đã tăng đáng kể so với các mô-đun Tesla V100 của thế hệ Volta, mặc dù phần cuối của chúng bị che khuất khỏi tầm nhìn của người bình thường. bởi các nắp phía trên. Giới hạn thực tế cho thiết kế này là 400 W năng lượng nhiệt. Điều này cũng được khẳng định qua những đặc điểm chính thức của A100 ở phiên bản SXM3 được công bố ngày hôm nay.

Bên cạnh GPU A100 trên bo mạch chủ là sáu công tắc giao diện NVLink thế hệ thứ ba, cùng nhau cung cấp khả năng trao đổi dữ liệu hai chiều với tốc độ 4,8 TB/s. NVIDIA cũng rất quan tâm đến việc làm mát của họ, được đánh giá bằng các bộ tản nhiệt cấu hình đầy đủ với ống dẫn nhiệt. Mỗi GPU được phân bổ 12 kênh giao diện NVLink, các GPU lân cận có thể trao đổi dữ liệu với tốc độ 600 GB/s.

Hệ thống DGX A100 cũng chứa chín bộ điều khiển mạng Mellanox ConnectX-6 HDR, có khả năng truyền thông tin với tốc độ lên tới 200 Gbit/s. Tổng cộng, DGX A100 cung cấp khả năng truyền dữ liệu hai chiều với tốc độ 3,6 TB/s. Hệ thống này cũng sử dụng các công nghệ Mellanox độc quyền nhằm mở rộng hiệu quả các hệ thống máy tính có kiến ​​trúc như vậy. Hỗ trợ PCI Express 4.0 ở cấp độ nền tảng được xác định bởi bộ xử lý thế hệ AMD EPYC Rome, do đó, giao diện này không chỉ được sử dụng bởi các bộ tăng tốc đồ họa A100 mà còn bởi các ổ đĩa thể rắn với giao thức NVMe.

NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

Ngoài DGX A100, NVIDIA đã bắt đầu cung cấp cho các đối tác của mình bo mạch HGX A100, đây là một trong những thành phần của hệ thống máy chủ mà các nhà sản xuất khác sẽ tự sản xuất. Một bo mạch HGX A100 duy nhất có thể chứa bốn hoặc tám GPU NVIDIA A100. Ngoài ra, vì nhu cầu riêng của mình, NVIDIA đã lắp ráp DGX SuperPOD - cụm gồm 140 hệ thống DGX A100, cung cấp hiệu suất ở mức 700 petaflop với kích thước tổng thể khá khiêm tốn. Công ty hứa sẽ cung cấp hỗ trợ về mặt phương pháp cho các đối tác mong muốn xây dựng các cụm máy tính tương tự dựa trên DGX A100. Nhân tiện, NVIDIA chỉ mất không quá một tháng để xây dựng DGX SuperPOD thay vì vài tháng hoặc thậm chí nhiều năm như thông thường đối với những nhiệm vụ như vậy.

NVIDIA DGX A100: nền tảng dựa trên Ampere đầu tiên cung cấp hiệu năng gấp XNUMX petaflop

Theo NVIDIA, việc giao DGX A100 đã bắt đầu với mức giá 199 USD mỗi bản, các đối tác của công ty đã lưu trữ các hệ thống này trong cụm đám mây của họ và hệ sinh thái đã bao phủ 000 quốc gia, bao gồm cả Việt Nam và UAE. Ngoài ra, các giải pháp đồ họa với kiến ​​trúc Ampere rất có thể dự đoán sẽ là một phần của hệ thống siêu máy tính Perlmutter, do Cray tạo ra cho Bộ Năng lượng Hoa Kỳ. Nó sẽ bao gồm bộ xử lý đồ họa NVIDIA Ampere cùng với bộ xử lý trung tâm thế hệ AMD EPYC Milan với kiến ​​trúc Zen 26. Các nút siêu máy tính dựa trên NVIDIA Ampere sẽ đến tay khách hàng vào nửa cuối năm nay, mặc dù những bản sao đầu tiên đã đến phòng thí nghiệm chuyên môn của bộ Mỹ.



Nguồn: 3dnews.ru

Thêm một lời nhận xét