GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Після того, як NVIDIA продемонструвала трасування променів у реальному часі на відеокартах серії GeForce RTX, важко сумніватися в тому, що саме за цією технологією (в розумному поєднанні з алгоритмом растеризації) майбутнє комп'ютерних ігор. Однак графічні процесори на основі архітектури Turing зі спеціалізованими RT-ядрами до недавнього часу вважалися єдиною категорією дискретних GPU, яка має в своєму розпорядженні відповідну обчислювальну потужність.

Як показали тести перших ігор, що освоїли Ray Tracing (Battlefield V, Metro Exodus і Shadow of the Tomb Raider), навіть прискорювачі GeForce RTX (особливо молодший з них – RTX 2060) зазнають суттєвого падіння частоти зміни кадрів у завданнях гібридного рендерингу. Незважаючи на перші успіхи, трасування променів у реальному часі ще не можна вважати зрілою технологією. Лише тоді, коли не лише найпередовіші та найдорожчі пристрої, а й графічні карти середнього цінового рівня досягнуть колишніх стандартів швидкодії в іграх нової хвилі, можна буде оголосити, що зміна парадигм, запущена компанією Дженсена Хуанга, нарешті відбулася.

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Трасування променів на "Паскалях" - за і проти

Але вже зараз, поки ще не сказано жодного слова про майбутнього наступника архітектури Turing, NVIDIA вирішила підштовхнути прогрес. На заході GPU Technology Conference минулого місяця зелена команда повідомила, що прискорювачі на чіпах Pascal, а також молодші представники сімейства Turing (серія GeForce GTX 16) набудуть функції трасування променів у реальному часі нарівні з продуктами під маркою RTX. Сьогодні обіцяний драйвер вже можна завантажити на офіційному сайті NVIDIA, а список пристроїв включає моделі сімейства GeForce 10, починаючи з GeForce GTX 1060 (версія 6 Гбайт), професійний прискорювач TITAN V на чіпі Volta, і, зрозуміло, нові моделі середньої цінової категорії на чіпі TU116 - GeForce GTX 1660 і GTX 1660 Ti. Оновлення торкнулося і ноутбуків із відповідними GPU.

З технічного погляду тут немає нічого надприродного. Графічні процесори з уніфікованими шейдерними блоками могли виконувати Ray Tracing задовго до появи архітектури Turing, хоча в той час не мали достатньої швидкодії для того, щоб ця можливість була затребувана в іграх. Крім того, був відсутній єдиний стандарт програмних методів, крім закритих API на кшталт фірмового NVIDIA OptiX. Тепер, коли існує розширення DXR для Direct3D 12 та аналогічні бібліотеки в інтерфейсі програмування Vulkan, ігровий двигун може звертатися до них незалежно від того, чи оснащений графічний процесор спеціалізованою логікою – аби драйвер давав таку можливість. У чіпів Turing для цієї мети є окремі RT-ядра, а в GPU архітектури Pascal та процесорі TU116 трасування променів реалізовано у форматі обчислень загального призначення на масиві шейдерних ALU.

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Однак все, що нам відомо про архітектуру Turing зі слів самої NVIDIA, говорить про те, що Pascal не годиться для додатків із підтримкою DXR. У минулорічній презентації, присвяченій флагманським моделям сімейства Turing – GeForce RTX 2080 та RTX 2080 Ti – інженери наводили такі викладки. Якщо залишити всі ресурси найкращої зі споживчих відеокарт минулого покоління - GeForce GTX 1080 Ti - на обчислення трасування променів, то підсумкова продуктивність не перевищить 11% від того, на що теоретично здатний RTX 2080 Ti. Не менш важливим є те, що вільні CUDA-ядра чіпа Turing в той же час можна використовувати для паралельної обробки інших компонентів зображення — виконання шейдерних програм, черги неграфічних розрахунків Direct3D при асинхронному виконанні і так далі.

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

У реальних іграх ситуація складніша, адже на існуючому залозі розробники дозовано користуються функціями DXR, а левову частку обчислювального навантаження, як і раніше, займає розтеризація та шейдерні інструкції. До того ж, частина різних ефектів, які створюються за допомогою трасування променів, непогано виконуються і на CUDA-ядрах чіпів Pascal. Наприклад, дзеркальні поверхні Battlefield V не мають на увазі вторинного відображення променів, а отже, є посильним навантаженням для потужних відеокарт минулого покоління. Те саме стосується й тіней у Shadow of the Tomb Raider, хоча рендеринг складних тіней, сформованих кількома джерелами світла, вже є складнішим завданням. А ось глобальне освітлення в Metro Exodus важко дається навіть «Тьюрингу», і від Pascal не можна очікувати в будь-якій мірі порівнянних результатів.

Як не крути, йдеться про багаторазову різницю в теоретичній швидкодії між представниками архітектури Turing та їх найближчими аналогами на кремнії Pascal. Причому користь Turing грає як присутність RT-ядер, а й численні вдосконалення загального характеру, властиві прискорювачам нового покоління. Так, чіпи Turing вміють паралельно виконувати операції над речовими (FP32) і цілими (INT) даними, несуть великий обсяг локальної кеш-пам'яті та окремі CUDA-ядра для розрахунків зниженої точності (FP16). Все це означає, що Turing не лише краще справляється з шейдерними програмами, а й може порівняно ефективно обраховувати трасування променів без спеціалізованих блоків. Адже настільки ресурсомістким рендеринг за допомогою Ray Tracing робить не тільки і не стільки пошук перетинів між променями та елементами геометрії (яким займаються RT-ядра), скільки обчислення кольору в точці перетину (shading). І між іншим, перелічені переваги архітектури Turing повною мірою ставляться до GeForce GTX 1660 і GTX 1660 Ti, хоча в чіпі TU116 немає RT-ядер, тому тести цих відеокарт з програмним трасуванням променів становлять окремий інтерес.

Але досить теорії, адже ми вже зібрали дані про продуктивність Паскалей (а також молодших Т'юрінгів) в Battlefield V, Metro Exodus і Shadow of the Tomb Raider на основі власних вимірювань. Зауважимо, що ні драйвер, ні самі ігри не регулюють кількість променів для того, щоб знизити навантаження на GPU без RT-ядер, а значить, якість ефектів на GeForce GTX та GeForce RTX має бути однаковою.

Тестовий стенд, методика тестування

Тестовий стенд
центральний процесор Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц у AVX, фіксована частота)
Материнська плата ASUS MAXIMUS XI APEX
Оперативна пам'ять G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок живлення Corsair AX1200i, 1200 Вт
Система охолодження CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
монітор NEC EA244UHD
Операційна система Windows 10 Pro x64
ПЗ для GPU NVIDIA
NVIDIA GeForce RTX 20 NVIDIA GeForce Game Ready Driver 419.67
NVIDIA GeForce GTX 10/16 NVIDIA GeForce Game Ready Driver 425.31
Ігрові тести
Гра API Налаштування, метод тестування Повноекранне згладжування
1920 × 1080 / 2560 × 1440 3840 × 2160
Battlefield V DirectX 12 OCAT, місія Liberte. Макс. якість графіки TAA High TAA High
метро Результат DirectX 12 Вбудований бенчмарк. Профіль якості графіки Ultra ТАА ТАА
Тінь Raider Tomb DirectX 12 Вбудований бенчмарк. Макс. якість графіки SMAA 4x Выкл.

Показники середньої та мінімальної кадрових частот виводяться з масиву часу рендерингу індивідуальних кадрів, який записує вбудований бенчмарк (Metro Exodus, Shadow of the Tomb Raider) або утиліта OCAT, якщо його немає (Battlefield V).

Середня частота зміни кадрів на діаграмах є величиною, оберненою до середнього часу кадру. Для оцінки мінімальної кадрової частоти обчислюється кількість кадрів, сформованих кожної секунди тесту. З цього масиву чисел вибирається значення, що відповідає 1-му відсоткові розподілу.

Учасники тестування

У тестуванні продуктивності взяли участь такі відеокарти:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 МГц, 11 Гбайт);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 МГц, 8 Гбайт);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 МГц, 8 Гбайт);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 МГц, 6 Гбайт);
  • NVIDIA GeForce GTX 1660 Ti (6 Гбайт);
  • NVIDIA GeForce GTX 1660 (6 Гбайт);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 МГц, 11 Гбайт);
  • NVIDIA GeForce GTX 1080 (1607/10000 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт);
  • NVIDIA GeForce GTX 1060 (1506/9000 МГц, 6 Гбайт).

Battlefield V

Завдяки тому, що Battlefield V сама по собі є досить невибагливою грою (особливо в режимах 1080p і 1440p), а трасування променів у ній застосовується фрагментарно, випробування GeForce 10-ї серії з опцією DXR принесло результати, що обнадійливі. Втім, з усіх моделей без підтримки Ray Tracing на рівні кремнію нам довелося обмежитись моделями GTX 1070/1070 Ti та GTX 1080/1080 Ti. Ігри Electronic Arts з підозрою реагують на часті зміни конфігурації заліза і блокують користувача на період в одну або кілька діб. Тому виміри продуктивності GeForce GTX 1060 та двох пристроїв серії GeForce GTX 16 з'являться в цій статті пізніше, як тільки Battlefield V зніме обмеження з нашої тестової машини.

У відсотковому вираженні кожен із учасників тестування відчуває приблизно однакове падіння швидкодії при різних установках якості трасування променів незалежно від роздільної здатності екрана. Так, швидкодія відеокарт під маркою GeForce RTX 20 знижується на 28-43% при низькій і середній якості ефектів DXR, а при високій і максимальній - на 37-53%.

Якщо йдеться про старші моделі сімейства GeForce 10, то на рівнях трасування променів Low і Medium гра втрачає від 36 до 42% FPS, а при високій якості (налаштування High та Ultra) DXR з'їдає вже 54-67% частоти зміни кадрів. Зауважимо, що у багатьох, якщо не в більшості ігрових сцен Battlefield V немає вираженої різниці між налаштуваннями Low та Medium, а також між High та Ultra – ні за чіткістю зображення, ні за швидкодією. В надії на те, що графічні процесори Pascal виявляться більш чутливими до цього параметра, ми провели тести за всіх чотирьох налаштувань. І справді, виявилися певні відмінності, але тільки при роздільній здатності 2160p і в межах 6% FPS.

В абсолютних показниках будь-який із старших прискорювачів на чіпах Pascal може підтримувати кадрову частоту вище 60 FPS у режимі 1080p при зниженій якості відображення, а GeForce GTX 1080 Ti претендує на аналогічний результат навіть при трасуванні на рівні High. Але варто перейти до роздільної здатності 1440p, і вже лише GeForce GTX 1080 і GTX 1080 Ti забезпечують комфортний фреймрейт на рівні 60 FPS і вище при якості трасування променів Low або Medium, а в режимі 4К жодна з карт минулого покоління не має відповідної обчислювальної потужності ( як, втім, і будь-який Turing крім флагманського GeForce RTX 2080 Ti).

Якщо шукати паралелі між конкретними прискорювачами під маркою GeForce GTX 10 і GeForce RTX 20, то найкраща модель минулого покоління (GeForce GTX 1080 Ti), яка в завданнях стандартного рендерингу без DXR є аналогом GeForce RTX 2080, опустилася на рівень GeForce RTX трасування променів, а за високого може боротися хіба що з GeForce RTX 2070.

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Battlefield V, макс. Якість
1920 × 1080 TAA
RT Off RT Low RT Середній RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% НД НД НД НД

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Battlefield V, макс. Якість
2560 × 1440 TAA
RT Off RT Low RT Середній RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% НД НД НД НД

GeForce RTX більше не потрібен? Тести трасування променів на прискорювачах GeForce GTX 10 та 16

Battlefield V, макс. Якість
3840 × 2160 TAA
RT Off RT Low RT Середній RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% НД НД НД НД
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% НД НД НД НД

Джерело: 3dnews.ru

Додати коментар або відгук