在NVIDIA在GeForce RTX系列顯示卡上示範了即時光線追蹤之後,很難懷疑這項技術(與光柵化演算法的合理結合)是電腦遊戲的未來。 然而,直到最近,基於圖靈架構且具有專用 RT 核心的 GPU 仍被認為是唯一具有適合於此的運算能力的離散 GPU。
對首批掌握光線追蹤技術的遊戲(《戰地2060》、《地鐵:離去》和《古墓奇兵:暗影》)的測試表明,即使是GeForce RTX 加速器(尤其是其中最年輕的RTX XNUMX) ,在混合渲染任務。 儘管早期取得了成功,即時光線追蹤還不是一項成熟的技術。 只有當不僅最先進、最昂貴的設備,而且中階顯示卡在新一波遊戲中達到相同的性能標準時,才能宣告黃仁勳公司發起的典範轉移終於發生。
帕斯卡中的光線追蹤 - 優點和缺點
但現在,雖然沒有提及圖靈架構的未來後繼者,但 NVIDIA 已決定推動進步。 在上個月的 GPU 技術大會活動上,綠色團隊宣布 Pascal 晶片上的加速器以及圖靈家族的低端成員(GeForce GTX 16 系列)將獲得與 RTX 同等的實時光線追踪功能- 品牌產品。 如今,所承諾的驅動程式已經可以在 NVIDIA 官方網站上下載,設備清單包括 GeForce 10 系列的型號,從 GeForce GTX 1060(6 GB 版本)、Volta 晶片上的專業 TITAN V 加速器開始,當然,還有採用TU116 晶片的中價位新型號- GeForce GTX 1660 和GTX 1660 Ti。 該更新還影響了具有相應 GPU 的筆記型電腦。
從技術角度來看,這裡沒有什麼超自然的。 早在圖靈架構出現之前,具有統一著色器單元的 GPU 就能夠執行光線追踪,儘管當時它們的速度還不夠快,無法滿足遊戲中對這種功能的需求。 此外,除了專有的 NVIDIA OptiX 等封閉 API 之外,軟體方法沒有統一的標準。 現在,Vulkan 程式介面中已經有了針對 Direct3D 12 的 DXR 擴充功能以及類似的函式庫,無論 GPU 是否配備了專門的邏輯,遊戲引擎都可以存取它們,只要驅動程式提供了這種能力。 為此,Turing 晶片具有獨立的 RT 核心,在 Pascal 架構 GPU 和 TU116 處理器中,光線追蹤以通用運算格式在著色器 ALU 陣列上實現。
然而,我們從 NVIDIA 本身了解到的有關圖靈架構的一切都表明 Pascal 不適合支援 DXR 的應用程式。 在去年專門針對 Turing 系列旗艦機型(GeForce RTX 2080 和 RTX 2080 Ti)的示範中,工程師提出了以下計算結果。 如果將上一代最好的消費等級顯示卡(GeForce GTX 1080 Ti)的所有資源投入光線追蹤運算,所得效能不會超過 RTX 11 Ti 理論效能的 2080%。 同樣重要的是,Turing 晶片的免費 CUDA 核心可以同時用於其他圖像組件的平行處理 - 著色器程式的執行、非同步執行期間的非圖形 Direct3D 計算佇列等。
在實際遊戲中,情況更為複雜,因為在現有的硬體上開發人員大量使用DXR功能,而大部分計算負載仍然被光柵化和著色器指令佔據。 此外,使用光線追蹤創建的一些各種效果也可以在 Pascal 晶片的 CUDA 核心上很好地執行。 例如,《戰地 V》中的鏡面並不意味著光線的二次反射,因此對於上一代強大的顯示卡來說是一個可行的負載。 這也適用於《古墓奇兵:暗影》中的陰影,儘管渲染由多個光源形成的複雜陰影已經是一項更加困難的任務。 但即使對於圖靈來說,《地鐵:離去》的全球覆蓋範圍也很困難,並且不能指望帕斯卡在任何程度上產生類似的結果。
無論人們怎麼說,我們談論的是圖靈架構的代表與 Pascal 晶片上最接近的類似物之間理論性能的多重差異。 此外,不僅 RT 核心的存在,而且新一代加速器的許多整體改進特徵也對圖靈有利。 因此,Turing 晶片可以對實數 (FP32) 和整數 (INT) 資料執行並行運算,攜帶大量本地快取記憶體和單獨的 CUDA 核心以進行降低精度計算 (FP16)。 所有這些意味著圖靈不僅可以更好地處理著色器程序,而且還可以相對有效地計算光線追踪,而無需專門的區塊。 畢竟,使用光線追蹤進行渲染如此消耗資源的原因不僅在於搜尋光線和幾何元素之間的交點(RT 核心所做的),還在於計算交點處的顏色(著色)。 順便說一句,所列出的圖靈架構的優勢完全適用於 GeForce GTX 1660 和 GTX 1660 Ti,儘管 TU116 晶片沒有 RT 核心,因此使用軟體光線追蹤對這些顯示卡進行測試特別令人感興趣。
但理論已經足夠了,因為我們已經根據我們自己的測量收集了“Pascals”(以及年輕的“Turings”)在《戰地XNUMX》、《地鐵:離去》和《古墓奇兵:暗影》中的表現數據。 請注意,驅動程式和遊戲本身都不會調整光線數量,以減少沒有 RT 核心的 GPU 的負載,這意味著 GeForce GTX 和 GeForce RTX 上的效果品質應該是相同的。
測試台、測試方法
試驗台 | |
---|---|
中央處理器 | 英特爾酷睿 i9-9900K(4,9 GHz、4,8 GHz AVX、固定頻率) |
主機板 | 華碩 MAXIMUS XI APEX |
手術記憶 | 奇技 Trident Z RGB F4-3200C14D-16GTZR,2 x 8 GB(3200 MHz,CL14) |
只讀存儲器 | 英特爾固態碟盤 760p,1024 GB |
電源 | 海盜船 AX1200i,1200 瓦 |
CPU冷卻系統 | 海盜船 Hydro 系列 H115i |
住房 | 酷冷至尊測試台V1.0 |
顯示器 | NEC EA244UHD |
操作系統 | Windows 10 Pro x64 |
NVIDIA GPU 軟體 | |
NVIDIA GeForce RTX 20 | NVIDIA GeForce 遊戲就緒驅動程式 419.67 |
NVIDIA GeForce GTX 10/16 | NVIDIA GeForce 遊戲就緒驅動程式 425.31 |
遊戲測試 | ||||
---|---|---|---|---|
遊玩 | API | 設定、測試方法 | 全螢幕抗鋸齒 | |
1920×1080 / 2560×1440 | 3840×2160 | |||
戰場V | DirectX的12 | OCAT,自由使命。 最大限度。 圖形品質 | TAA 高中 | TAA 高中 |
地鐵出運 | DirectX的12 | 內建基準。 超圖形品質配置文件 | TAA | TAA |
古墓麗影的陰影 | DirectX的12 | 內建基準。 最大限度。 圖形品質 | SMAA 4x | 離開 |
平均和最低幀速率指標源自各個幀的渲染時間數組,該數組由內建基準測試(《地鐵:離去》、《古墓奇兵:暗影》)或 OCAT 實用程式(如果遊戲沒有)記錄(戰地V)。
圖表中的平均幀速率是平均幀時間的倒數。 為了估計最小幀速率,需要計算測試中每秒形成的幀數。 從該數字數組中,選擇與分佈的第一個百分位數相對應的值。
測試參與者
以下顯示卡參與了效能測試:
- NVIDIA GeForce RTX 2080 Ti 創辦人版(1350/14000 MHz,11 GB);
- NVIDIA GeForce GTX 2080 創辦人版(1515/14000 MHz,8 GB);
- NVIDIA GeForce RTX 2070 創辦人版(1410/14000 MHz,8 GB);
- NVIDIA GeForce RTX 2060 創辦人版(1365/14000 MHz,6 GB);
- NVIDIA GeForce GTX 1660 Ti (6 GB);
- NVIDIA GeForce GTX 1660 (6 GB);
- NVIDIA GeForce GTX 1080 Ti(1480/11000 MHz,11 GB);
- NVIDIA GeForce GTX 1080(1607/10000 MHz,8 GB);
- NVIDIA GeForce GTX 1070 Ti(1608/8008 MHz,8 GB);
- NVIDIA GeForce GTX 1070(1506/8008 MHz,8 GB);
- NVIDIA GeForce GTX 1060(1506/9000 MHz,6 GB)。
戰場V
由於《戰地 V》本身是一款相當輕量的遊戲(尤其是在 1080p 和 1440p 模式下),並且它在補丁中使用光線追踪,因此使用 DXR 選項測試 GeForce 10 系列取得了令人鼓舞的結果。 然而,在晶片級不支援光線追蹤的所有型號中,我們不得不將自己限制在 GTX 1070/1070 Ti 和 GTX 1080/1080 Ti 型號上。 Electronic Arts 遊戲會對硬體配置的頻繁更改產生懷疑,並會阻止使用者一段或幾天的時間。 因此,一旦《戰地 V》從我們的測試機中取消限制,GeForce GTX 1060 和兩款 GeForce GTX 16 系列設備的性能測量結果就會出現在本文中。
從百分比來看,無論螢幕解析度如何,任何測試參與者在各種光線追蹤品質設定下都經歷了大致相同的性能下降。 因此,GeForce RTX 20 品牌的顯示卡在低品質和中品質 DXR 效果下表現下降 28-43%,在高品質和最高品質下表現下降 37-53%。
如果我們談論的是GeForce 10 系列的舊型號,那麼在低和中光線追蹤等級下,遊戲的FPS 會下降36% 到42%,而在高品質(高和超高設定)下,DXR 已經消耗了54-67%幀速率的%。 請注意,在許多(如果不是大多數)戰地 V 遊戲場景中,低設定和中設定之間、高設定和超高設定之間在影像清晰度或效能方面沒有明顯差異。 為了希望 Pascal GPU 對此設定更加敏感,我們在所有四種設定下進行了測試。 事實上,確實出現了某些差異,但僅限於 2160p 解析度和 6% FPS 以內。
從絕對意義上講,Pascal 晶片上的任何較舊加速器都可以在60p 模式下將幀速率維持在1080 FPS 以上,但反射質量會降低,而GeForce GTX 1080 Ti 聲稱即使在高級別跟踪時也能得到類似的結果。 但一旦轉向 1440p 分辨率,只有 GeForce GTX 1080 和 GTX 1080 Ti 能夠提供 60 FPS 或更高的舒適幀率以及低或中光線追蹤質量,並且在 4K 模式下,上一代顯示卡都沒有合適的計算能力(事實上,除了旗艦版GeForce RTX 2080 Ti 之外,任何Turing 都一樣。
如果我們尋找 GeForce GTX 10 和 GeForce RTX 20 品牌下的特定加速器之間的相似之處,那麼上一代的最佳型號 (GeForce GTX 1080 Ti) 相當於在沒有 DXR 的標準渲染任務中的 GeForce RTX 2080,由於光線追蹤品質下降,下降到了GeForce RTX 2070 的水平,而在高水平上它只能與GeForce RTX 2060 對抗。
戰地 V,最大品質 | |||||
---|---|---|---|---|---|
1920×1080 高清 | |||||
即時關閉 | 保留時間低 | 逆轉錄培養基 | 保留時間高 | 超RT | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 企業排放佔全球 100% | -28% | -28% | -37% | -39% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 企業排放佔全球 100% | -34% | -35% | -43% | -44% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 企業排放佔全球 100% | -35% | -36% | -46% | -45% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 企業排放佔全球 100% | -42% | -43% | -50% | -51% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1660 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 企業排放佔全球 100% | -40% | -39% | -54% | -58% |
NVIDIA GeForce GTX 1080 (8 GB) | 企業排放佔全球 100% | -41% | -41% | -57% | -61% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 企業排放佔全球 100% | -40% | -41% | -57% | -59% |
NVIDIA GeForce GTX 1070 (8 GB) | 企業排放佔全球 100% | -38% | -39% | -57% | -61% |
NVIDIA GeForce GTX 1060 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
戰地 V,最大品質 | |||||
---|---|---|---|---|---|
2560×1440 高清 | |||||
即時關閉 | 保留時間低 | 逆轉錄培養基 | 保留時間高 | 超RT | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 企業排放佔全球 100% | -33% | -34% | -44% | -45% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 企業排放佔全球 100% | -37% | -38% | -47% | -49% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 企業排放佔全球 100% | -36% | -36% | -48% | -48% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 企業排放佔全球 100% | -41% | -42% | -51% | -52% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1660 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 企業排放佔全球 100% | -40% | -40% | -59% | -62% |
NVIDIA GeForce GTX 1080 (8 GB) | 企業排放佔全球 100% | -36% | -39% | -59% | -63% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 企業排放佔全球 100% | -39% | -39% | -58% | -62% |
NVIDIA GeForce GTX 1070 (8 GB) | 企業排放佔全球 100% | -38% | -38% | -59% | -63% |
NVIDIA GeForce GTX 1060 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
戰地 V,最大品質 | |||||
---|---|---|---|---|---|
3840×2160 高清 | |||||
即時關閉 | 保留時間低 | 逆轉錄培養基 | 保留時間高 | 超RT | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 企業排放佔全球 100% | -30% | -30% | -44% | -47% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 企業排放佔全球 100% | -31% | -32% | -46% | -49% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 企業排放佔全球 100% | -40% | -38% | -53% | -52% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 企業排放佔全球 100% | -28% | -30% | -44% | -53% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1660 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 企業排放佔全球 100% | -36% | -37% | -60% | -63% |
NVIDIA GeForce GTX 1080 (8 GB) | 企業排放佔全球 100% | -40% | -43% | -64% | -67% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 企業排放佔全球 100% | -38% | -42% | -62% | -65% |
NVIDIA GeForce GTX 1070 (8 GB) | 企業排放佔全球 100% | -36% | -42% | -63% | -66% |
NVIDIA GeForce GTX 1060 (6 GB) | 企業排放佔全球 100% | 釹 | 釹 | 釹 | 釹 |
來源: 3dnews.ru