Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Po tym, jak NVIDIA zademonstrowała ray tracing w czasie rzeczywistym na kartach graficznych z serii GeForce RTX, trudno wątpić, że ta technologia (w rozsądnym połączeniu z algorytmem rasteryzacji) to przyszłość gier komputerowych. Jednak procesory graficzne oparte na architekturze Turing z wyspecjalizowanymi rdzeniami RT były do ​​niedawna uważane za jedyną kategorię dyskretnych procesorów graficznych, które dysponują odpowiednią do tego mocą obliczeniową.

Jak wykazały testy pierwszych gier, które opanowały Ray Tracing (Battlefield V, Metro Exodus i Shadow of the Tomb Raider), nawet akceleratory GeForce RTX (zwłaszcza najmłodszy z nich, RTX 2060) odnotowują znaczny spadek liczby klatek na sekundę w zadania renderowania hybrydowego. Pomimo wczesnych sukcesów ray tracing w czasie rzeczywistym nie jest jeszcze technologią dojrzałą. Dopiero gdy nie tylko najbardziej zaawansowane i najdroższe urządzenia, ale także karty graficzne ze średniej półki osiągną te same standardy wydajności w nowej fali gier, będzie można stwierdzić, że zapoczątkowana przez firmę Jensena Huanga zmiana paradygmatu wreszcie nastąpiła.

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Ray tracing w paskalach – zalety i wady

Ale teraz, choć nie powiedziano ani słowa o przyszłym następcy architektury Turing, NVIDIA postanowiła pobudzić postęp. W zeszłym miesiącu na konferencji GPU Technology Conference zielony zespół ogłosił, że akceleratory na chipach Pascal, a także słabsi członkowie rodziny Turing (seria GeForce GTX 16), zyskają funkcjonalność ray tracingu w czasie rzeczywistym na poziomie RTX -markowe produkty. Dziś obiecany sterownik można już pobrać na oficjalnej stronie NVIDIA, a na liście urządzeń znajdują się modele z rodziny GeForce 10, zaczynając od GeForce GTX 1060 (wersja 6 GB), profesjonalnego akceleratora TITAN V na chipie Volta, i oczywiście nowo przybyłe modele ze średniej półki cenowej na chipie TU116 - GeForce GTX 1660 i GTX 1660 Ti. Aktualizacja dotyczy także laptopów z odpowiednimi procesorami graficznymi.

Z technicznego punktu widzenia nie ma tu nic nadprzyrodzonego. Procesory graficzne ze zunifikowanymi jednostkami cieniującymi były w stanie wykonywać Ray Tracing na długo przed pojawieniem się architektury Turing, chociaż w tamtym czasie nie były wystarczająco szybkie, aby taka funkcja była pożądana w grach. Ponadto nie istniał jednolity standard metod oprogramowania, inny niż zamknięte interfejsy API, takie jak zastrzeżony NVIDIA OptiX. Teraz, gdy w interfejsie programistycznym Vulkan dostępne jest rozszerzenie DXR dla Direct3D 12 i podobnych bibliotek, silnik gry może uzyskać do nich dostęp niezależnie od tego, czy procesor graficzny jest wyposażony w wyspecjalizowaną logikę, o ile sterownik zapewnia taką możliwość. W tym celu chipy Turinga mają osobne rdzenie RT, a w procesorach graficznych o architekturze Pascal i procesorze TU116 śledzenie promieni jest realizowane w formacie obliczeniowym ogólnego przeznaczenia na szeregu jednostek cieniujących ALU.

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Jednak wszystko, co wiemy o architekturze Turing od samej firmy NVIDIA, sugeruje, że Pascal nie nadaje się do aplikacji obsługujących DXR. W zeszłorocznej prezentacji poświęconej flagowym modelom rodziny Turing – GeForce RTX 2080 i RTX 2080 Ti – inżynierowie przedstawili poniższe obliczenia. Jeśli w obliczeniach ray tracingu wrzucimy wszystkie zasoby najlepszej konsumenckiej karty graficznej ostatniej generacji – GeForce GTX 1080 Ti – uzyskana wydajność nie przekroczy 11% tego, do czego teoretycznie jest zdolny RTX 2080 Ti. Równie ważne jest to, że wolne rdzenie CUDA układu Turinga można jednocześnie wykorzystać do równoległego przetwarzania innych komponentów obrazu - wykonywania programów cieniujących, kolejki niegraficznych obliczeń Direct3D podczas wykonywania asynchronicznego i tak dalej.

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

W prawdziwych grach sytuacja jest bardziej skomplikowana, ponieważ na istniejącym sprzęcie programiści wykorzystują funkcje DXR w dawkach, a lwią część obciążenia obliczeniowego nadal zajmują instrukcje rasteryzacji i shaderów. Ponadto niektóre z różnych efektów tworzonych za pomocą śledzenia promieni można również dobrze wykonać na rdzeniach CUDA chipów Pascal. Na przykład lustrzane powierzchnie w Battlefield V nie oznaczają wtórnego odbicia promieni i dlatego stanowią wykonalne obciążenie dla wydajnych kart graficznych poprzedniej generacji. To samo tyczy się cieni w Shadow of the Tomb Raider, choć renderowanie skomplikowanych cieni tworzonych przez wiele źródeł światła jest już trudniejszym zadaniem. Ale globalny zasięg w Metro Exodus jest trudny nawet dla Turinga i nie można oczekiwać, że Pascal osiągnie w jakimkolwiek stopniu porównywalne wyniki.

Cokolwiek by nie powiedzieć, mówimy o wielokrotnej różnicy w wydajności teoretycznej pomiędzy przedstawicielami architektury Turinga a ich najbliższymi analogami na krzemie Pascala. Co więcej, na korzyść Turinga przemawia nie tylko obecność rdzeni RT, ale także liczne ogólne ulepszenia charakterystyczne dla akceleratorów nowej generacji. Dzięki temu chipy Turinga mogą wykonywać równoległe operacje na danych rzeczywistych (FP32) i całkowitych (INT), przenosić dużą ilość lokalnej pamięci podręcznej i oddzielne rdzenie CUDA do obliczeń o zmniejszonej precyzji (FP16). Wszystko to oznacza, że ​​Turing nie tylko lepiej radzi sobie z programami cieniującymi, ale potrafi też stosunkowo efektywnie obliczać śledzenie promieni bez wyspecjalizowanych bloków. W końcu to, co sprawia, że ​​renderowanie przy użyciu Ray Tracingu wymaga tak dużej ilości zasobów, to nie tylko i nie tyle poszukiwanie przecięć promieni i elementów geometrii (co robią rdzenie RT), ale obliczenie koloru w punkcie przecięcia (cieniowanie). A tak na marginesie, wymienione zalety architektury Turing w pełni dotyczą GeForce GTX 1660 i GTX 1660 Ti, chociaż układ TU116 nie ma rdzeni RT, dlatego szczególnie interesujące są testy tych kart graficznych z programowym śledzeniem promieni.

Ale dość teorii, bo dane na temat wydajności „Pascalów” (a także młodszych „Turingów”) w Battlefield V, Metro Exodus i Shadow of the Tomb Raider zebraliśmy już na podstawie własnych pomiarów. Należy pamiętać, że ani sterownik, ani same gry nie dostosowują liczby promieni w celu zmniejszenia obciążenia procesorów graficznych bez rdzeni RT, co oznacza, że ​​jakość efektów na GeForce GTX i GeForce RTX powinna być taka sama.

Stanowisko badawcze, metodologia badań

Stanowisko badawcze
CPU Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, stała częstotliwość)
Płyta główna ASUS MAXIMUS XI APEX
RAM G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM Dysk SSD Intel 760p, 1024 GB
Zasilacz Corsair AX1200i, 1200 W
Układ chłodzenia procesora Seria Corsair Hydro H115i
obudowa Stanowisko testowe CoolerMaster V1.0
Monitoruj NEC EA244UHD
System operacyjny Okna 10 Pro x64
Oprogramowanie GPU NVIDIA
NVIDIA GeForce RTX 20 Sterownik NVIDIA GeForce Game Ready 419.67
NVIDIA GeForce GTX 10/16 Sterownik NVIDIA GeForce Game Ready 425.31
Testy gry
Gra API Ustawienia, metoda testowania Antyaliasing na pełnym ekranie
1920 × 1080/2560 × 1440 × 3840 2160
Battlefield V. DirectX 12 OCAT, misja Liberte. Maks. Jakość grafiki Wysoki poziom TAA Wysoki poziom TAA
Metro Exodus DirectX 12 Wbudowany benchmark. Profil jakości Ultra Graphics TAA TAA
Shadow of Tomb Raider DirectX 12 Wbudowany benchmark. Maks. Jakość grafiki SMAA 4x Wyłączony

Wskaźniki średniej i minimalnej liczby klatek na sekundę pochodzą z tablicy czasów renderowania poszczególnych klatek, która jest rejestrowana przez wbudowany benchmark (Metro Exodus, Shadow of the Tomb Raider) lub narzędzie OCAT, jeśli gra go nie posiada (Pole Bitwy V).

Średnia liczba klatek na sekundę na wykresach jest odwrotnością średniego czasu klatek. Aby oszacować minimalną liczbę klatek na sekundę, obliczana jest liczba klatek tworzonych w każdej sekundzie testu. Z tej tablicy liczb wybierana jest wartość odpowiadająca 1. percentylowi rozkładu.

Uczestnicy testu

W testach wydajności wzięły udział następujące karty graficzne:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 MHz, 11 GB);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Battlefield V.

Z uwagi na to, że sam Battlefield V jest dość lekką grą (szczególnie w trybach 1080p i 1440p) i wykorzystuje w patchach ray tracing, testowanie serii GeForce 10 z opcją DXR przyniosło zachęcające rezultaty. Jednak ze wszystkich modeli pozbawionych obsługi Ray Tracing na poziomie krzemu musieliśmy ograniczyć się do modeli GTX 1070/1070 Ti i GTX 1080/1080 Ti. Gry Electronic Arts reagują podejrzliwie na częste zmiany w konfiguracji sprzętowej i blokują użytkownika na okres jednego lub kilku dni. Dlatego też pomiary wydajności GeForce GTX 1060 oraz dwóch urządzeń z serii GeForce GTX 16 pojawią się w tym artykule w dalszej części artykułu, gdy tylko Battlefield V usunie ograniczenia z naszej maszyny testowej.

W ujęciu procentowym każdy z uczestników testu doświadczył mniej więcej takiego samego spadku wydajności przy różnych ustawieniach jakości śledzenia promieni, niezależnie od rozdzielczości ekranu. Tym samym wydajność kart graficznych marki GeForce RTX 20 spada o 28–43% przy niskiej i średniej jakości efektach DXR oraz o 37–53% przy wysokiej i maksymalnej jakości.

Jeśli mówimy o starszych modelach z rodziny GeForce 10, to na poziomach Low i Medium ray tracing gra traci od 36 do 42% FPS, a przy wysokiej jakości (ustawienia High i Ultra) DXR zżera już 54–67 % szybkości klatek. Należy pamiętać, że w wielu, jeśli nie w większości scen gry Battlefield V, nie ma zauważalnej różnicy pomiędzy ustawieniami Niskimi i Średnimi, ani pomiędzy Wysokimi i Ultra, zarówno pod względem przejrzystości obrazu, jak i wydajności. W nadziei, że procesory graficzne Pascal będą bardziej wrażliwe na to ustawienie, przeprowadziliśmy testy na wszystkich czterech ustawieniach. Rzeczywiście, pojawiły się pewne różnice, ale tylko przy rozdzielczości 2160p i w granicach 6% FPS.

W wartościach bezwzględnych każdy ze starszych akceleratorów na układach Pascal może utrzymać liczbę klatek na sekundę powyżej 60 FPS w trybie 1080p przy obniżonej jakości odbicia, a GeForce GTX 1080 Ti osiąga podobny wynik nawet przy śledzeniu na poziomie Wysokim. Ale po przejściu na rozdzielczość 1440p, tylko GeForce GTX 1080 i GTX 1080 Ti zapewniają komfortową liczbę klatek na sekundę na poziomie 60 FPS lub więcej przy niskiej lub średniej jakości ray tracingu, a w trybie 4K żadna z kart poprzedniej generacji nie ma odpowiedniej mocy obliczeniowej ( jak zresztą każdy Turing z wyjątkiem flagowego GeForce RTX 2080 Ti).

Jeśli szukać podobieństw pomiędzy konkretnymi akceleratorami spod marki GeForce GTX 10 i GeForce RTX 20, to najlepszy model poprzedniej generacji (GeForce GTX 1080 Ti), będący analogiem GeForce RTX 2080 w standardowych zadaniach renderowania bez DXR, spadł do poziomu GeForce RTX 2070 z obniżoną jakością ray tracingu, a na wysokich poziomach może walczyć jedynie z GeForce RTX 2060.

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Pole bitwy V, maks. Jakość
1920×1080 TAA
Wyłączony RT Niski Średni RT RT Wysoka RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Pole bitwy V, maks. Jakość
2560×1440 TAA
Wyłączony RT Niski Średni RT RT Wysoka RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Nowy artykuł: GeForce RTX nie jest już potrzebny? Testy ray tracingu na akceleratorach GeForce GTX 10 i 16

Pole bitwy V, maks. Jakość
3840×2160 TAA
Wyłączony RT Niski Średni RT RT Wysoka RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Źródło: 3dnews.ru

Dodaj komentarz