Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Sau khi NVIDIA trình diễn tính năng dò tia thời gian thực trên card màn hình dòng GeForce RTX, khó có thể nghi ngờ rằng công nghệ này (kết hợp hợp lý với thuật toán rasterization) chính là tương lai của trò chơi máy tính. Tuy nhiên, GPU dựa trên kiến ​​trúc Turing với lõi RT chuyên dụng cho đến gần đây vẫn được coi là loại GPU rời duy nhất có sức mạnh tính toán phù hợp cho việc này.

Như thử nghiệm của các trò chơi đầu tiên đã thành thạo Ray Tracing (Battlefield V, Metro Exodus và Shadow of the Tomb Raider) đã cho thấy, ngay cả các bộ tăng tốc GeForce RTX (đặc biệt là bộ tăng tốc trẻ nhất trong số đó, RTX 2060) cũng gặp phải tình trạng giảm đáng kể tốc độ khung hình trong nhiệm vụ kết xuất kết hợp. Bất chấp những thành công ban đầu, dò tia thời gian thực vẫn chưa phải là một công nghệ trưởng thành. Chỉ khi không chỉ các thiết bị tiên tiến và đắt tiền nhất mà cả các card đồ họa tầm trung cũng đạt được tiêu chuẩn hiệu năng tương tự trong làn sóng trò chơi mới, thì mới có thể tuyên bố rằng sự thay đổi mô hình do công ty của Jensen Huang đưa ra cuối cùng đã diễn ra.

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Dò tia trong Pascals - ưu và nhược điểm

Nhưng hiện tại, dù chưa có một lời nào được nói đến về kiến ​​trúc kế nhiệm tương lai của kiến ​​trúc Turing, NVIDIA đã quyết định thúc đẩy sự phát triển. Tại sự kiện Hội nghị Công nghệ GPU vào tháng trước, nhóm xanh đã thông báo rằng các bộ tăng tốc trên chip Pascal, cũng như các thành viên cấp thấp hơn của dòng Turing (dòng GeForce GTX 16), sẽ có chức năng dò tia thời gian thực ngang bằng với RTX -Sản phẩm có thương hiệu. Ngày nay, trình điều khiển đã hứa đã có thể được tải xuống trên trang web chính thức của NVIDIA và danh sách các thiết bị bao gồm các mẫu thuộc dòng GeForce 10, bắt đầu với GeForce GTX 1060 (phiên bản 6 GB), bộ tăng tốc TITAN V chuyên nghiệp trên chip Volta, và tất nhiên, các mẫu chip giá trung bình mới xuất hiện trên chip TU116 - GeForce GTX 1660 và GTX 1660 Ti. Bản cập nhật cũng ảnh hưởng đến máy tính xách tay có GPU tương ứng.

Từ quan điểm kỹ thuật, không có gì siêu nhiên ở đây. GPU với các đơn vị đổ bóng thống nhất đã có thể thực hiện Ray Tracing từ rất lâu trước khi kiến ​​trúc Turing ra đời, mặc dù vào thời điểm đó chúng không đủ nhanh để khả năng này được yêu cầu trong các trò chơi. Ngoài ra, không có tiêu chuẩn thống nhất cho các phương pháp phần mềm, ngoài các API đóng như NVIDIA OptiX độc quyền. Giờ đây đã có tiện ích mở rộng DXR cho Direct3D 12 và các thư viện tương tự trong giao diện lập trình Vulkan, công cụ trò chơi có thể truy cập chúng bất kể GPU có được trang bị logic chuyên dụng hay không, miễn là trình điều khiển cung cấp khả năng này. Các chip Turing có các lõi RT riêng biệt cho mục đích này và trong GPU kiến ​​trúc Pascal và bộ xử lý TU116, dò tia được triển khai ở định dạng điện toán đa năng trên một mảng ALU đổ bóng.

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Tuy nhiên, mọi thứ chúng ta biết về kiến ​​trúc Turing từ chính NVIDIA đều cho thấy rằng Pascal không phù hợp với các ứng dụng hỗ trợ DXR. Trong bài thuyết trình năm ngoái dành riêng cho các mẫu hàng đầu của gia đình Turing - GeForce RTX 2080 và RTX 2080 Ti - các kỹ sư đã trình bày các tính toán sau. Nếu bạn ném tất cả tài nguyên của card đồ họa tiêu dùng tốt nhất thế hệ trước - GeForce GTX 1080 Ti - vào các tính toán dò tia, hiệu suất thu được sẽ không vượt quá 11% so với khả năng của RTX 2080 Ti về mặt lý thuyết. Điều quan trọng không kém là các lõi CUDA miễn phí của chip Turing có thể được sử dụng đồng thời để xử lý song song các thành phần hình ảnh khác - thực thi các chương trình đổ bóng, hàng đợi các phép tính Direct3D phi đồ họa trong quá trình thực thi không đồng bộ, v.v.

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Trong các trò chơi thực, tình hình phức tạp hơn, bởi vì trên các nhà phát triển phần cứng hiện có sử dụng các hàm DXR theo liều lượng và phần lớn tải trọng tính toán vẫn bị chiếm giữ bởi các hướng dẫn rasterization và shader. Ngoài ra, một số hiệu ứng khác nhau được tạo bằng phương pháp dò tia cũng có thể được thực thi tốt trên lõi CUDA của chip Pascal. Ví dụ: bề mặt gương trong Battlefield V không bao hàm sự phản xạ thứ cấp của các tia và do đó là tải khả thi cho các card màn hình mạnh mẽ của thế hệ trước. Điều tương tự cũng áp dụng cho các bóng trong Shadow of the Tomb Raider, mặc dù việc tạo ra các bóng phức tạp được hình thành bởi nhiều nguồn sáng đã là một nhiệm vụ khó khăn hơn. Nhưng phạm vi phủ sóng toàn cầu của Metro Exodus là điều khó khăn ngay cả đối với Turing và Pascal không thể mong đợi tạo ra kết quả tương đương ở bất kỳ mức độ nào.

Dù người ta có thể nói gì, chúng ta đang nói về sự khác biệt đa dạng về hiệu suất lý thuyết giữa các đại diện của kiến ​​trúc Turing và các kiến ​​trúc tương tự gần nhất của chúng trên silicon Pascal. Hơn nữa, không chỉ sự hiện diện của lõi RT mà còn có nhiều cải tiến chung đặc trưng của máy gia tốc thế hệ mới cũng có lợi cho Turing. Do đó, chip Turing có thể thực hiện các hoạt động song song trên dữ liệu thực (FP32) và số nguyên (INT), mang một lượng lớn bộ nhớ đệm cục bộ và các lõi CUDA riêng biệt để tính toán với độ chính xác giảm (FP16). Tất cả điều này có nghĩa là Turing không chỉ xử lý các chương trình đổ bóng tốt hơn mà còn có thể tính toán dò tia tương đối hiệu quả mà không cần các khối chuyên dụng. Suy cho cùng, điều khiến việc kết xuất bằng Ray Tracing tốn nhiều tài nguyên không chỉ là việc tìm kiếm các điểm giao nhau giữa các tia và các phần tử hình học (điều mà lõi RT thực hiện) mà còn là việc tính toán màu tại điểm giao nhau (bóng đổ). Và nhân tiện, những ưu điểm được liệt kê của kiến ​​​​trúc Turing hoàn toàn áp dụng cho GeForce GTX 1660 và GTX 1660 Ti, mặc dù chip TU116 không có lõi RT, vì vậy các bài kiểm tra các card màn hình này bằng phần mềm dò tia được đặc biệt quan tâm.

Nhưng lý thuyết là đủ rồi, vì chúng tôi đã thu thập dữ liệu về hiệu suất của “Pascals” (cũng như “Turings” trẻ hơn) trong Battlefield V, Metro Exodus và Shadow of the Tomb Raider dựa trên các phép đo của riêng chúng tôi. Lưu ý rằng cả trình điều khiển và trò chơi đều không điều chỉnh số lượng tia để giảm tải cho GPU không có lõi RT, điều đó có nghĩa là chất lượng hiệu ứng trên GeForce GTX và GeForce RTX phải giống nhau.

Bệ thử nghiệm, phương pháp thử nghiệm

Kiểm tra đứng
CPU Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, tần số cố định)
Bo mạch chủ ĐỈNH ASUS MAXIMUS XI
RAM G.Skill Cây đinh ba Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM Intel SSD 760p, 1024GB
Bộ cấp nguồn Corsair AX1200i, 1200W
Hệ thống làm mát CPU Corsair Hydro Series H115i
Nhà ở Bàn thử nghiệm CoolerMaster V1.0
Giám sát NEC EA244UHD
Hệ điều hành Windows 10 Pro x64
Phần mềm GPU NVIDIA
NVIDIA GeForce RTX 20 Trình điều khiển sẵn sàng cho trò chơi NVIDIA GeForce 419.67
NVIDIA GeForce GTX 10/16 Trình điều khiển sẵn sàng cho trò chơi NVIDIA GeForce 425.31
Kiểm tra trò chơi
Game API Cài đặt, phương pháp thử nghiệm Khử răng cưa toàn màn hình
1920×1080 / 2560×1440 × 3840 2160
Battlefield V DirectX 12 OCAT, sứ mệnh Liberte. Tối đa. chất lượng đồ họa TAA cao TAA cao
Metro Exodus DirectX 12 Điểm chuẩn tích hợp. Cấu hình chất lượng đồ họa cực cao TAA TAA
Shadow of the Tomb Raider DirectX 12 Điểm chuẩn tích hợp. Tối đa. chất lượng đồ họa SMAA 4x Tắt

Các chỉ số về tốc độ khung hình trung bình và tối thiểu được lấy từ mảng thời gian kết xuất của từng khung hình riêng lẻ, được ghi lại bằng điểm chuẩn tích hợp (Metro Exodus, Shadow of the Tomb Raider) hoặc tiện ích OCAT, nếu trò chơi không có. (Chiến trường V).

Tốc độ khung hình trung bình trong biểu đồ là nghịch đảo của thời gian kết xuất khung hình trung bình. Để ước tính tốc độ khung hình tối thiểu, số lượng khung hình được hình thành trong mỗi giây của bài kiểm tra sẽ được tính toán. Từ mảng số này, giá trị tương ứng với phân vị thứ 1 của phân phối được chọn.

Người tham gia thử nghiệm

Các card màn hình sau đã tham gia thử nghiệm hiệu suất:

  • Phiên bản dành cho người sáng lập NVIDIA GeForce RTX 2080 Ti (1350/14000 MHz, 11 GB);
  • Phiên bản dành cho người sáng lập NVIDIA GeForce GTX 2080 (1515/14000 MHz, 8 GB);
  • Phiên bản dành cho người sáng lập NVIDIA GeForce RTX 2070 (1410/14000 MHz, 8 GB);
  • Phiên bản dành cho người sáng lập NVIDIA GeForce RTX 2060 (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Battlefield V

Do bản thân Battlefield V là một trò chơi khá nhẹ (đặc biệt là ở chế độ 1080p và 1440p) và nó sử dụng tính năng dò tia trong các bản vá, nên việc thử nghiệm GeForce 10-series với tùy chọn DXR đã mang lại kết quả đáng khích lệ. Tuy nhiên, trong số tất cả các mẫu không hỗ trợ Ray Tracing ở cấp độ silicon, chúng tôi phải giới hạn ở các mẫu GTX 1070/1070 Ti và GTX 1080/1080 Ti. Trò chơi Electronic Arts phản ứng với sự nghi ngờ trước những thay đổi thường xuyên trong cấu hình phần cứng và chặn người dùng trong khoảng thời gian một hoặc vài ngày. Do đó, phép đo hiệu năng của GeForce GTX 1060 và hai thiết bị dòng GeForce GTX 16 sẽ xuất hiện trong bài viết này sau, ngay khi Battlefield V loại bỏ các hạn chế khỏi máy thử nghiệm của chúng tôi.

Về mặt tỷ lệ phần trăm, bất kỳ người tham gia thử nghiệm nào cũng gặp phải tình trạng giảm hiệu suất gần như nhau ở các cài đặt chất lượng dò tia khác nhau, bất kể độ phân giải màn hình. Do đó, hiệu suất của card màn hình mang nhãn hiệu GeForce RTX 20 giảm 28–43% với hiệu ứng DXR chất lượng thấp và trung bình và 37–53% với chất lượng cao và tối đa.

Nếu chúng ta đang nói về các mẫu cũ hơn thuộc dòng GeForce 10, thì ở cấp độ dò tia Thấp và Trung bình, trò chơi mất từ ​​36 đến 42% FPS và ở chất lượng cao (cài đặt Cao và Siêu), DXR đã ngốn hết 54–67 % tốc độ khung hình. Lưu ý rằng trong nhiều cảnh, nếu không phải là hầu hết, các cảnh trong trò chơi Battlefield V không có sự khác biệt rõ ràng giữa cài đặt Thấp và Trung bình hoặc giữa Cao và Siêu, về độ rõ nét của hình ảnh hoặc hiệu suất. Với hy vọng GPU Pascal sẽ nhạy hơn với cài đặt này, chúng tôi đã chạy thử nghiệm ở cả bốn cài đặt. Thật vậy, đã xuất hiện một số khác biệt nhất định, nhưng chỉ ở độ phân giải 2160p và trong phạm vi 6% FPS.

Nói một cách tuyệt đối, bất kỳ bộ tăng tốc cũ nào trên chip Pascal đều có thể duy trì tốc độ khung hình trên 60 FPS ở chế độ 1080p với chất lượng phản chiếu giảm và GeForce GTX 1080 Ti khẳng định kết quả tương tự ngay cả khi theo dõi ở mức Cao. Nhưng khi bạn chuyển sang độ phân giải 1440p, chỉ GeForce GTX 1080 và GTX 1080 Ti cung cấp tốc độ khung hình thoải mái từ 60 FPS trở lên với chất lượng dò tia Thấp hoặc Trung bình và ở chế độ 4K, không có thẻ thế hệ trước nào có sức mạnh tính toán phù hợp ( thực tế là bất kỳ Turing nào ngoại trừ GeForce RTX 2080 Ti hàng đầu).

Nếu chúng tôi tìm kiếm sự tương đồng giữa các bộ tăng tốc cụ thể thuộc nhãn hiệu GeForce GTX 10 và GeForce RTX 20, thì mẫu tốt nhất của thế hệ trước (GeForce GTX 1080 Ti), tương tự như GeForce RTX 2080 trong các tác vụ kết xuất tiêu chuẩn không có DXR, tụt xuống ngang mức GeForce RTX 2070 với khả năng dò tia chất lượng giảm và ở mức cao chỉ có thể chiến đấu với GeForce RTX 2060.

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Chiến trường V, tối đa. Chất lượng
1920×1080 TAA
Tắt RT RT thấp RT phương tiện RT cao RT siêu
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Chiến trường V, tối đa. Chất lượng
2560×1440 TAA
Tắt RT RT thấp RT phương tiện RT cao RT siêu
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Bài viết mới: GeForce RTX không còn cần thiết nữa? Thử nghiệm dò tia trên bộ tăng tốc GeForce GTX 10 và 16

Chiến trường V, tối đa. Chất lượng
3840×2160 TAA
Tắt RT RT thấp RT phương tiện RT cao RT siêu
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Nguồn: 3dnews.ru

Thêm một lời nhận xét