Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Poté, co NVIDIA předvedla ray tracing v reálném čase na grafických kartách řady GeForce RTX, je těžké pochybovat o tom, že tato technologie (v rozumné kombinaci s rasterizačním algoritmem) je budoucností počítačových her. GPU založené na architektuře Turing se specializovanými jádry RT však byly donedávna považovány za jedinou kategorii diskrétních GPU, které mají k tomu vhodný výpočetní výkon.

Jak ukázaly testy prvních her, které zvládly Ray Tracing (Battlefield V, Metro Exodus a Shadow of the Tomb Raider), dokonce i akcelerátory GeForce RTX (zejména nejmladší z nich, RTX 2060) zažívají výrazný pokles snímkové frekvence v hybridní úlohy vykreslování. Navzdory dřívějším úspěchům není sledování paprsků v reálném čase ještě vyspělou technologií. Teprve když nejen nejpokročilejší a nejdražší zařízení, ale i grafické karty střední třídy dosáhnou stejných výkonových standardů v nové vlně her, bude možné prohlásit, že k posunu paradigmatu, který zahájila společnost Jensen Huang, konečně došlo.

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Ray tracing v Pascalech - výhody a nevýhody

Ale nyní, zatímco o budoucím nástupci architektury Turing nepadlo ani slovo, se NVIDIA rozhodla urychlit pokrok. Na konferenci GPU Technology Conference minulý měsíc zelený tým oznámil, že akcelerátory na čipech Pascal, stejně jako nižší členové rodiny Turing (řada GeForce GTX 16), získají funkce sledování paprsku v reálném čase na stejné úrovni jako RTX. - značkové produkty. Dnes je již slíbený ovladač ke stažení na oficiálních stránkách NVIDIA a v seznamu zařízení jsou modely rodiny GeForce 10 počínaje GeForce GTX 1060 (6 GB verze), profesionálním akcelerátorem TITAN V na čipu Volta, počínaje GeForce GTX 116 (1660 GB verze), a samozřejmě nově příchozí modely ve střední cenové kategorii na čipu TU1660 - GeForce GTX XNUMX a GTX XNUMX Ti. Aktualizace se dotkla i notebooků s odpovídajícími GPU.

Z technického hlediska zde není nic nadpřirozeného. GPU s unifikovanými shader jednotkami dokázaly provádět Ray Tracing dávno před příchodem architektury Turing, i když v té době nebyly dostatečně rychlé, aby tato schopnost byla ve hrách žádaná. Kromě toho neexistoval žádný jednotný standard pro softwarové metody, kromě uzavřených API, jako je proprietární NVIDIA OptiX. Nyní, když je v programovacím rozhraní Vulkan rozšíření DXR pro Direct3D 12 a podobné knihovny, může k nim herní engine přistupovat bez ohledu na to, zda je GPU vybaveno specializovanou logikou, pokud ovladač tuto schopnost poskytuje. Turingovy čipy mají pro tento účel samostatná jádra RT a v GPU architektury Pascal a procesoru TU116 je sledování paprsku implementováno v obecném výpočetním formátu na poli shaderových ALU.

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Nicméně vše, co víme o architektuře Turing od samotné NVIDIA, naznačuje, že Pascal není vhodný pro aplikace s podporou DXR. V loňské prezentaci věnované vlajkovým modelům rodiny Turing – GeForce RTX 2080 a RTX 2080 Ti – inženýři představili následující výpočty. Pokud do výpočtů ray tracingu hodíte všechny prostředky nejlepší spotřebitelské grafické karty poslední generace – GeForce GTX 1080 Ti, nepřesáhne výsledný výkon 11 % toho, čeho je RTX 2080 Ti teoreticky schopna. Neméně důležité je, že volná CUDA jádra Turingova čipu lze zároveň využít pro paralelní zpracování dalších obrazových komponent – ​​provádění shader programů, frontu negrafických výpočtů Direct3D při asynchronním provádění atp.

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

V reálných hrách je situace složitější, protože na stávajícím hardwaru vývojáři využívají DXR funkce v dávkách a lví podíl na výpočetní zátěži stále zabírají rasterizační a shaderové instrukce. Kromě toho některé z různých efektů, které jsou vytvořeny pomocí sledování paprsků, lze také dobře provádět na jádrech CUDA čipů Pascal. Například zrcadlové povrchy v Battlefield V neznamenají sekundární odraz paprsků, a proto jsou vhodnou zátěží pro výkonné grafické karty předchozí generace. Totéž platí pro stíny v Shadow of the Tomb Raider, i když vykreslování složitých stínů tvořených více zdroji světla je již náročnější úkol. Globální pokrytí v Metro Exodus je ale obtížné i pro Turinga a od Pascalu nelze očekávat v žádném rozsahu srovnatelné výsledky.

Ať už se dá říci cokoli, mluvíme o mnohonásobném rozdílu v teoretickém výkonu mezi zástupci architektury Turing a jejich nejbližšími analogy na křemíku Pascal. V Turingův prospěch navíc hraje nejen přítomnost RT jader, ale také četná obecná vylepšení charakteristická pro akcelerátory nové generace. Turingovy čipy tak mohou provádět paralelní operace s reálnými (FP32) a celočíselnými (INT) daty, přenášet velké množství lokální mezipaměti a oddělená jádra CUDA pro výpočty se sníženou přesností (FP16). To vše znamená, že Turing nejen lépe zvládá shader programy, ale dokáže také poměrně efektivně počítat ray tracing bez specializovaných bloků. Ostatně to, co dělá vykreslování pomocí Ray Tracing tak náročným na zdroje, není jen a ne tolik hledání průsečíků mezi paprsky a prvky geometrie (což dělají jádra RT), ale výpočet barvy v průsečíku (stínování). A mimochodem, uvedené výhody architektury Turing plně platí pro GeForce GTX 1660 a GTX 1660 Ti, ačkoli čip TU116 nemá RT jádra, takže testy těchto grafických karet se softwarovým sledováním paprsků jsou obzvláště zajímavé.

Ale dost teorie, protože data o výkonu „Pascalů“ (ale i mladších „Turingů“) v Battlefield V, Metro Exodus a Shadow of the Tomb Raider jsme již nasbírali na základě vlastních měření. Všimněte si, že ani ovladač, ani hry samotné neupravují počet paprsků za účelem snížení zátěže GPU bez RT jader, což znamená, že kvalita efektů na GeForce GTX a GeForce RTX by měla být stejná.

Testovací stanoviště, metodika testování

Zkušební stojan
procesor Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, pevná frekvence)
Základní deska ASUS MAXIMUS XI APEX
Operační paměť G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM Intel SSD 760p, 1024 GB
Napájecí zdroj Corsair AX1200i, 1200 W
Systém chlazení CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Monitor NEC EA244UHD
Operační systém Windows 10 Pro x64
Software GPU NVIDIA
NVIDIA GeForce RTX 20 NVIDIA GeForce Game Ready ovladač 419.67
NVIDIA GeForce GTX 10/16 NVIDIA GeForce Game Ready ovladač 425.31
Herní testy
Hra API Nastavení, způsob testování Vyhlazování na celé obrazovce
1920×1080 / 2560×1440 × 3840 2160
Battlefield V DirectX 12 OCAT, mise Liberte. Max. kvalita obrazu Vysoká TAA Vysoká TAA
Metro Exodus DirectX 12 Vestavěný benchmark. Ultra Graphics Quality Profile TAA TAA
Stín Tomb Raider DirectX 12 Vestavěný benchmark. Max. kvalita obrazu SMAA 4x Vypnuto

Indikátory průměrné a minimální snímkové frekvence jsou odvozeny z pole vykreslovacích časů jednotlivých snímků, které zaznamenává vestavěný benchmark (Metro Exodus, Shadow of the Tomb Raider) nebo utilita OCAT, pokud ji hra nemá. (Bitevní pole V).

Průměrná snímková frekvence v grafech je převrácená hodnota průměrné doby snímkování. Pro odhad minimální snímkové frekvence se vypočítá počet snímků vytvořených za každou sekundu testu. Z tohoto pole čísel se vybere hodnota odpovídající 1. percentilu rozdělení.

Účastníci testu

Testování výkonu se zúčastnily následující grafické karty:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 MHz, 11 GB);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Battlefield V

Vzhledem k tomu, že Battlefield V je sám o sobě poměrně lehkou hrou (zejména v režimech 1080p a 1440p) a využívá ray tracing v záplatách, testování GeForce řady 10 s možností DXR přineslo povzbudivé výsledky. Ze všech modelů bez podpory Ray Tracing na křemíkové úrovni jsme se však museli omezit na modely GTX 1070/1070 Ti a GTX 1080/1080 Ti. Hry Electronic Arts reagují s podezřením na časté změny hardwarové konfigurace a blokují uživatele na dobu jednoho nebo několika dnů. Proto se měření výkonu GeForce GTX 1060 a dvou zařízení řady GeForce GTX 16 objeví v tomto článku později, jakmile Battlefield V odstraní omezení z našeho testovacího stroje.

Procentuálně každý z účastníků testu zaznamenal přibližně stejný pokles výkonu při různých nastaveních kvality sledování paprsku, bez ohledu na rozlišení obrazovky. Výkon grafických karet pod značkou GeForce RTX 20 tak klesá o 28–43 % u DXR efektů nízké a střední kvality a o 37–53 % u vysoké a maximální kvality.

Pokud se bavíme o starších modelech rodiny GeForce 10, tak na úrovních Low a Medium ray tracing hra ztrácí od 36 do 42 % FPS a při vysoké kvalitě (nastavení High a Ultra) DXR žere už 54–67 % snímkové frekvence. Všimněte si, že v mnoha, ne-li ve většině, herních scén Battlefield V není žádný rozeznatelný rozdíl mezi nastavením Low a Medium nebo mezi High a Ultra, a to jak v čistotě obrazu, tak ve výkonu. V naději, že GPU Pascal budou na toto nastavení citlivější, provedli jsme testy ve všech čtyřech nastaveních. Určité rozdíly se skutečně objevily, ale pouze v rozlišení 2160p a do 6 % FPS.

V absolutních číslech může kterýkoli ze starších akcelerátorů na čipech Pascal udržet snímkovou frekvenci nad 60 FPS v režimu 1080p se sníženou kvalitou odrazu a GeForce GTX 1080 Ti tvrdí podobný výsledek i při trasování na úrovni High. Jakmile ale přejdete na rozlišení 1440p, pouze GeForce GTX 1080 a GTX 1080 Ti poskytují pohodlnou snímkovou rychlost 60 FPS nebo vyšší s nízkou nebo střední kvalitou sledování paprsku a v režimu 4K nemá žádná z karet předchozí generace vhodný výpočetní výkon ( jako vlastně jakýkoli Turing s výjimkou vlajkové lodi GeForce RTX 2080 Ti).

Pokud budeme hledat paralely mezi konkrétními akcelerátory pod značkami GeForce GTX 10 a GeForce RTX 20, pak nejlepší model předchozí generace (GeForce GTX 1080 Ti), který je obdobou GeForce RTX 2080 ve standardních renderovacích úlohách bez DXR, klesl na úroveň GeForce RTX 2070 se sníženou kvalitou ray tracingu a na vysokých úrovních může bojovat pouze s GeForce RTX 2060.

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Battlefield V, max. Kvalitní
1920×1080 TAA
RT vypnuto RT nízká RT Střední RT vysoká RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1660 (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 GB) 100% Nd Nd Nd Nd

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Battlefield V, max. Kvalitní
2560×1440 TAA
RT vypnuto RT nízká RT Střední RT vysoká RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1660 (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 GB) 100% Nd Nd Nd Nd

Nový článek: GeForce RTX již není potřeba? Testy sledování paprsku na akcelerátorech GeForce GTX 10 a 16

Battlefield V, max. Kvalitní
3840×2160 TAA
RT vypnuto RT nízká RT Střední RT vysoká RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1660 (6 GB) 100% Nd Nd Nd Nd
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 GB) 100% Nd Nd Nd Nd

Zdroj: 3dnews.ru

Přidat komentář