Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Nachdem NVIDIA Echtzeit-Raytracing auf den Grafikkarten der GeForce RTX-Serie demonstriert hat, kann man kaum daran zweifeln, dass diese Technologie (in sinnvoller Kombination mit dem Rasterisierungsalgorithmus) die Zukunft von Computerspielen ist. Allerdings galten GPUs auf Basis der Turing-Architektur mit spezialisierten RT-Kernen bis vor Kurzem als die einzige Kategorie diskreter GPUs, die über die dafür geeignete Rechenleistung verfügen.

Wie Tests der ersten Spiele, die Ray Tracing beherrschen (Battlefield V, Metro Exodus und Shadow of the Tomb Raider), gezeigt haben, verzeichnen selbst GeForce RTX-Beschleuniger (insbesondere der jüngste von ihnen, der RTX 2060) einen deutlichen Rückgang der Bildraten Hybrid-Rendering-Aufgaben. Trotz erster Erfolge ist Echtzeit-Raytracing noch keine ausgereifte Technologie. Erst wenn nicht nur die fortschrittlichsten und teuersten Geräte, sondern auch Grafikkarten der Mittelklasse in der neuen Spielewelle die gleichen Leistungsstandards erreichen, kann man sagen, dass der von Jensen Huangs Unternehmen eingeleitete Paradigmenwechsel endlich stattgefunden hat.

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Raytracing in Pascals – Vor- und Nachteile

Doch obwohl noch kein Wort über den zukünftigen Nachfolger der Turing-Architektur verloren wurde, hat NVIDIA beschlossen, den Fortschritt voranzutreiben. Auf der GPU Technology Conference letzten Monat kündigte das grüne Team an, dass Beschleuniger auf Pascal-Chips sowie die unteren Mitglieder der Turing-Familie (GeForce GTX 16-Serie) Echtzeit-Raytracing-Funktionalität auf Augenhöhe mit RTX erhalten werden -Markenprodukte. Der versprochene Treiber kann bereits heute auf der offiziellen NVIDIA-Website heruntergeladen werden und die Geräteliste umfasst Modelle der GeForce 10-Familie, beginnend mit der GeForce GTX 1060 (6-GB-Version), dem professionellen TITAN V-Beschleuniger auf dem Volta-Chip, und natürlich neu eingetroffene Modelle der mittleren Preisklasse auf dem Chip TU116 - GeForce GTX 1660 und GTX 1660 Ti. Von dem Update waren auch Laptops mit entsprechenden GPUs betroffen.

Aus technischer Sicht gibt es hier nichts Übernatürliches. GPUs mit Unified-Shader-Einheiten waren schon lange vor dem Aufkommen der Turing-Architektur in der Lage, Raytracing durchzuführen, allerdings waren sie zu diesem Zeitpunkt noch nicht schnell genug, als dass diese Fähigkeit in Spielen gefragt gewesen wäre. Darüber hinaus gab es außer geschlossenen APIs wie dem proprietären NVIDIA OptiX keinen einheitlichen Standard für Softwaremethoden. Da es nun eine DXR-Erweiterung für Direct3D 12 und ähnliche Bibliotheken in der Vulkan-Programmierschnittstelle gibt, kann die Spiel-Engine darauf zugreifen, unabhängig davon, ob die GPU mit spezieller Logik ausgestattet ist, sofern der Treiber diese Fähigkeit bietet. Turing-Chips verfügen zu diesem Zweck über separate RT-Kerne, und in der GPU und dem TU116-Prozessor der Pascal-Architektur ist Raytracing in einem Allzweck-Computing-Format auf einem Array von Shader-ALUs implementiert.

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Allerdings deutet alles, was wir über die Turing-Architektur von NVIDIA selbst wissen, darauf hin, dass Pascal nicht für DXR-fähige Anwendungen geeignet ist. In der letztjährigen Präsentation zu den Flaggschiffmodellen der Turing-Familie – GeForce RTX 2080 und RTX 2080 Ti – stellten die Ingenieure die folgenden Berechnungen vor. Setzt man alle Ressourcen der besten Consumer-Grafikkarte der letzten Generation – der GeForce GTX 1080 Ti – in Raytracing-Berechnungen ein, wird die resultierende Leistung nicht mehr als 11 % dessen betragen, was die RTX 2080 Ti theoretisch leisten kann. Ebenso wichtig ist, dass die freien CUDA-Kerne des Turing-Chips gleichzeitig für die parallele Verarbeitung anderer Bildkomponenten genutzt werden können – die Ausführung von Shader-Programmen, eine Warteschlange nichtgrafischer Direct3D-Berechnungen während der asynchronen Ausführung usw.

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

In echten Spielen ist die Situation komplizierter, da Entwickler auf vorhandener Hardware dosiert DXR-Funktionen verwenden und der Löwenanteil der Rechenlast immer noch durch Rasterisierungs- und Shader-Anweisungen belegt wird. Darüber hinaus lassen sich einige der verschiedenen Effekte, die mittels Raytracing erzeugt werden, auch gut auf den CUDA-Kernen von Pascal-Chips ausführen. Spiegelflächen in Battlefield V bedeuten beispielsweise keine Sekundärreflexion von Strahlen und stellen daher eine mögliche Belastung für leistungsstarke Grafikkarten der vorherigen Generation dar. Das Gleiche gilt für Schatten in Shadow of the Tomb Raider, obwohl das Rendern komplexer Schatten, die durch mehrere Lichtquellen entstehen, bereits eine schwierigere Aufgabe ist. Aber selbst für Turing ist eine globale Berichterstattung in Metro Exodus schwierig, und von Pascal kann man nicht erwarten, dass er in irgendeiner Weise vergleichbare Ergebnisse liefert.

Was auch immer man sagen mag, wir sprechen von einem mehrfachen Unterschied in der theoretischen Leistung zwischen Vertretern der Turing-Architektur und ihren nächsten Analoga auf Pascal-Silizium. Darüber hinaus sprechen nicht nur das Vorhandensein von RT-Kernen, sondern auch zahlreiche allgemeine Verbesserungen, die für Beschleuniger der neuen Generation charakteristisch sind, für Turing. Somit können Turing-Chips parallele Operationen an realen (FP32) und ganzzahligen (INT) Daten durchführen, verfügen über eine große Menge an lokalem Cache-Speicher und separate CUDA-Kerne für Berechnungen mit reduzierter Genauigkeit (FP16). All dies bedeutet, dass Turing nicht nur Shader-Programme besser beherrscht, sondern auch Raytracing ohne spezielle Blöcke relativ effizient berechnen kann. Denn was das Rendern mit Ray Tracing so ressourcenintensiv macht, ist nicht nur und nicht so sehr die Suche nach Schnittpunkten zwischen Strahlen und Geometrieelementen (was RT-Kerne tun), sondern die Berechnung der Farbe am Schnittpunkt (Schattierung). Übrigens gelten die aufgeführten Vorteile der Turing-Architektur in vollem Umfang für die GeForce GTX 1660 und GTX 1660 Ti, obwohl der TU116-Chip über keine RT-Kerne verfügt, sodass Tests dieser Grafikkarten mit Software-Raytracing von besonderem Interesse sind.

Aber genug der Theorie, denn wir haben anhand unserer eigenen Messungen bereits Daten zur Leistung von „Pascals“ (sowie jüngeren „Turings“) in Battlefield V, Metro Exodus und Shadow of the Tomb Raider gesammelt. Beachten Sie, dass weder der Treiber noch die Spiele selbst die Anzahl der Strahlen anpassen, um die Belastung von GPUs ohne RT-Kerne zu reduzieren, was bedeutet, dass die Qualität der Effekte auf GeForce GTX und GeForce RTX gleich sein sollte.

Prüfstand, Prüfmethodik

Prüfstand
CPU Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, feste Frequenz)
Материнская плата ASUS MAXIMUS XI APEX
Rom G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM Intel SSD 760p, 1024 GB
Блок питания Corsair AX1200i, 1200 W
CPU-Kühlsystem Corsair Hydro-Serie H115i
Gehäuse CoolerMaster Prüfstand V1.0
Überwachen NEC EA244UHD
Operationssystem Windows-10 Pro x64
NVIDIA GPU-Software
NVIDIA GeForce RTX 20 NVIDIA GeForce Game Ready-Treiber 419.67
Nvidia GeForce GTX 10/16 NVIDIA GeForce Game Ready-Treiber 425.31
Spieltests
Spiel API Einstellungen, Testmethode Vollbild-Anti-Aliasing
1920×1080 / 2560×1440 3840 × 2160
Battlefield V DirectX 12 OCAT, Liberte-Mission. Max. Grafikqualität TAA hoch TAA hoch
Metro Exodus DirectX 12 Integrierter Benchmark. Ultra-Grafik-Qualitätsprofil TAA TAA
Shadow of the Tomb Raider DirectX 12 Integrierter Benchmark. Max. Grafikqualität SMAA 4X aus

Indikatoren für durchschnittliche und minimale Bildraten werden aus der Reihe der Renderzeiten einzelner Bilder abgeleitet, die vom integrierten Benchmark (Metro Exodus, Shadow of the Tomb Raider) oder dem OCAT-Dienstprogramm, falls das Spiel nicht über einen solchen verfügt, aufgezeichnet werden (Battlefield V).

Die durchschnittliche Bildrate in den Diagrammen ist der Kehrwert der durchschnittlichen Bildzeit. Um die minimale Bildrate abzuschätzen, wird die Anzahl der Bilder berechnet, die in jeder Testsekunde gebildet werden. Aus diesem Zahlenfeld wird der Wert ausgewählt, der dem 1. Perzentil der Verteilung entspricht.

Testteilnehmer

Die folgenden Grafikkarten nahmen am Leistungstest teil:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 MHz, 11 GB);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Battlefield V

Aufgrund der Tatsache, dass Battlefield V selbst ein recht leichtes Spiel ist (insbesondere im 1080p- und 1440p-Modus) und in Patches Raytracing verwendet, lieferte der Test der GeForce 10-Serie mit der DXR-Option ermutigende Ergebnisse. Von allen Modellen ohne Raytracing-Unterstützung auf Siliziumebene mussten wir uns jedoch auf die Modelle GTX 1070/1070 Ti und GTX 1080/1080 Ti beschränken. Electronic-Arts-Spiele reagieren misstrauisch auf häufige Änderungen der Hardwarekonfiguration und sperren den Nutzer für einen Zeitraum von einem oder mehreren Tagen. Daher werden Leistungsmessungen der GeForce GTX 1060 und zweier Geräte der GeForce GTX 16-Serie später in diesem Artikel erscheinen, sobald Battlefield V die Einschränkungen von unserer Testmaschine entfernt.

In Prozent ausgedrückt erlebte jeder der Testteilnehmer bei verschiedenen Raytracing-Qualitätseinstellungen ungefähr den gleichen Leistungsabfall, unabhängig von der Bildschirmauflösung. Somit sinkt die Leistung von Grafikkarten der Marke GeForce RTX 20 um 28–43 % bei DXR-Effekten niedriger und mittlerer Qualität und um 37–53 % bei hoher und maximaler Qualität.

Wenn es sich um ältere Modelle der GeForce 10-Familie handelt, verliert das Spiel auf den Raytracing-Stufen Low und Medium 36 bis 42 % der FPS, und bei hoher Qualität (Einstellungen High und Ultra) frisst DXR bereits 54–67 % der Bildrate. Beachten Sie, dass es in vielen, wenn nicht den meisten Battlefield V-Spielszenen keinen erkennbaren Unterschied zwischen den Einstellungen „Niedrig“ und „Mittel“ oder zwischen „Hoch“ und „Ultra“ gibt, weder hinsichtlich der Bildschärfe noch der Leistung. In der Hoffnung, dass Pascal-GPUs empfindlicher auf diese Einstellung reagieren, haben wir Tests mit allen vier Einstellungen durchgeführt. Tatsächlich traten gewisse Unterschiede auf, jedoch nur bei einer Auflösung von 2160p und innerhalb von 6 % FPS.

In absoluten Zahlen kann jeder der älteren Beschleuniger auf Pascal-Chips Bildraten über 60 FPS im 1080p-Modus mit reduzierter Reflexionsqualität aufrechterhalten, und die GeForce GTX 1080 Ti erzielt ein ähnliches Ergebnis, selbst wenn sie auf der hohen Stufe verfolgt wird. Sobald Sie jedoch auf die 1440p-Auflösung umsteigen, bieten nur die GeForce GTX 1080 und GTX 1080 Ti eine komfortable Bildrate von 60 FPS oder höher mit niedriger oder mittlerer Raytracing-Qualität, und im 4K-Modus verfügt keine der Karten der vorherigen Generation über eine geeignete Rechenleistung ( wie eigentlich jeder Turing mit Ausnahme des Flaggschiffs GeForce RTX 2080 Ti).

Wenn wir nach Parallelen zwischen bestimmten Beschleunigern der Marken GeForce GTX 10 und GeForce RTX 20 suchen, dann ist das beste Modell der vorherigen Generation (GeForce GTX 1080 Ti), das ein Analogon der GeForce RTX 2080 bei Standard-Rendering-Aufgaben ohne DXR ist, fiel auf das Niveau der GeForce RTX 2070 mit reduzierter Raytracing-Qualität und kann auf hohem Niveau nur noch mit der GeForce RTX 2060 mithalten.

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Battlefield V, max. Qualität
1920×1080 TAA
RT Aus RT niedrig RT-Mittel RT hoch RT-Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Battlefield V, max. Qualität
2560×1440 TAA
RT Aus RT niedrig RT-Mittel RT hoch RT-Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Neuer Artikel: GeForce RTX nicht mehr benötigt? Raytracing-Tests auf GeForce GTX 10- und 16-Beschleunigern

Battlefield V, max. Qualität
3840×2160 TAA
RT Aus RT niedrig RT-Mittel RT hoch RT-Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Source: 3dnews.ru

Kommentar hinzufügen