Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Després que NVIDIA demostrés el traçat de raigs en temps real a les targetes de vídeo de la sèrie GeForce RTX, és difícil dubtar que aquesta tecnologia (en combinació raonable amb l'algoritme de rasterització) sigui el futur dels jocs d'ordinador. Tanmateix, les GPU basades en l'arquitectura Turing amb nuclis RT especialitzats es consideraven fins fa poc l'única categoria de GPU discretes que tenen la potència de càlcul adequada per a això.

Com han demostrat les proves dels primers jocs que han dominat Ray Tracing (Battlefield V, Metro Exodus i Shadow of the Tomb Raider), fins i tot els acceleradors GeForce RTX (especialment el més jove d'ells, el RTX 2060) experimenten una caiguda important de les velocitats de fotogrames en tasques de renderització híbrida. Malgrat els primers èxits, el traçat de raigs en temps real encara no és una tecnologia madura. Només quan no només els dispositius més avançats i cars, sinó també les targetes gràfiques de gamma mitjana assoleixin els mateixos estàndards de rendiment en la nova onada de jocs, es podrà declarar que finalment s'ha produït el canvi de paradigma llançat per l'empresa de Jensen Huang.

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Traçat de raigs en Pascals: pros i contres

Però ara, tot i que no s'ha dit ni una paraula sobre el futur successor de l'arquitectura Turing, NVIDIA ha decidit impulsar el progrés. A l'esdeveniment de la Conferència de Tecnologia de la GPU el mes passat, l'equip verd va anunciar que els acceleradors dels xips Pascal, així com els membres de gamma baixa de la família Turing (sèrie GeForce GTX 16), obtindran una funcionalitat de traçat de raigs en temps real a l'igual que RTX. - productes de marca. Avui, el controlador promès ja es pot descarregar al lloc web oficial de NVIDIA i la llista de dispositius inclou models de la família GeForce 10, començant per la GeForce GTX 1060 (versió de 6 GB), l'accelerador professional TITAN V al xip Volta, i, per descomptat, models recentment arribats a la categoria de preu mitjà al xip TU116 - GeForce GTX 1660 i GTX 1660 Ti. L'actualització també va afectar els ordinadors portàtils amb les GPU corresponents.

Des del punt de vista tècnic, aquí no hi ha res de sobrenatural. Les GPU amb unitats d'ombres unificades podien dur a terme el traçat de raigs molt abans de l'arribada de l'arquitectura Turing, tot i que en aquell moment no eren prou ràpids perquè aquesta capacitat fos demandada als jocs. A més, no hi havia cap estàndard uniforme per als mètodes de programari, a part de les API tancades com la propietat NVIDIA OptiX. Ara que hi ha una extensió DXR per a Direct3D 12 i biblioteques similars a la interfície de programació Vulkan, el motor del joc pot accedir-hi independentment de si la GPU està equipada amb una lògica especialitzada, sempre que el controlador proporcioni aquesta capacitat. Els xips Turing tenen nuclis RT separats per a aquest propòsit, i a la GPU d'arquitectura Pascal i al processador TU116, el traçat de raigs s'implementa en un format informàtic de propòsit general en una matriu d'ALU d'ombra.

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Tanmateix, tot el que sabem sobre l'arquitectura Turing de la mateixa NVIDIA suggereix que Pascal no és adequat per a aplicacions habilitats per DXR. A la presentació de l'any passat dedicada als models emblemàtics de la família Turing - GeForce RTX 2080 i RTX 2080 Ti - els enginyers van presentar els càlculs següents. Si llenceu tots els recursos de la millor targeta gràfica de consum de l'última generació, la GeForce GTX 1080 Ti, als càlculs de traçat de raigs, el rendiment resultant no superarà l'11% del que teòricament és capaç de fer la RTX 2080 Ti. Igualment important és que els nuclis CUDA lliures del xip Turing es poden utilitzar alhora per al processament paral·lel d'altres components d'imatge: execució de programes shader, una cua de càlculs Direct3D no gràfics durant l'execució asíncrona, etc.

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

En els jocs reals, la situació és més complicada, perquè els desenvolupadors de maquinari existents utilitzen funcions DXR en dosis, i la part del lleó de la càrrega informàtica encara està ocupada per les instruccions de rasterització i shader. A més, alguns dels diferents efectes que es creen mitjançant el traçat de raigs també es poden executar bé als nuclis CUDA dels xips Pascal. Per exemple, les superfícies dels miralls de Battlefield V no impliquen una reflexió secundària dels raigs i, per tant, són una càrrega factible per a les potents targetes de vídeo de la generació anterior. El mateix s'aplica a les ombres a Shadow of the Tomb Raider, tot i que representar ombres complexes formades per múltiples fonts de llum ja és una tasca més difícil. Però la cobertura global a Metro Exodus és difícil fins i tot per a Turing, i no es pot esperar que Pascal produeixi resultats comparables en cap mesura.

Sigui el que es digui, estem parlant d'una diferència múltiple en el rendiment teòric entre els representants de l'arquitectura de Turing i els seus anàlegs més propers al silici Pascal. A més, no només la presència de nuclis RT, sinó també nombroses millores generals característiques dels acceleradors de nova generació juguen a favor de Turing. Així, els xips Turing poden realitzar operacions paral·leles en dades reals (FP32) i enteres (INT), transportar una gran quantitat de memòria cau local i nuclis CUDA separats per a càlculs de precisió reduïda (FP16). Tot això significa que Turing no només gestiona millor els programes d'ombra, sinó que també pot calcular el traçat de raigs de manera relativament eficient sense blocs especialitzats. Al cap i a la fi, el que fa que la renderització mitjançant el traçat de raigs sigui tan intensiva en recursos no és només i no tant la recerca d'interseccions entre raigs i elements de geometria (cosa que fan els nuclis RT), sinó el càlcul del color al punt d'intersecció (ombrejat). I, per cert, els avantatges enumerats de l'arquitectura de Turing s'apliquen plenament a la GeForce GTX 1660 i GTX 1660 Ti, tot i que el xip TU116 no té nuclis RT, de manera que les proves d'aquestes targetes de vídeo amb traçat de raigs de programari són de particular interès.

Però n'hi ha prou de teoria, perquè ja hem recollit dades sobre el rendiment de "Pascals" (així com de "Turings") més joves a Battlefield V, Metro Exodus i Shadow of the Tomb Raider basant-nos en les nostres pròpies mesures. Tingueu en compte que ni el controlador ni els propis jocs ajusten el nombre de raigs per reduir la càrrega de les GPU sense nuclis RT, la qual cosa significa que la qualitat dels efectes a GeForce GTX i GeForce RTX hauria de ser la mateixa.

Banc de proves, metodologia d'assaig

banc de proves
CPU Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, freqüència fixa)
Placa mare ASUS MAXIMUS XI APEX
Memòria operativa G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM SSD Intel 760p, 1024 GB
Unitat de font d'alimentació Corsair AX1200i, 1200 W
Sistema de refrigeració de la CPU Corsair Hydro Sèrie H115i
Habitatge Banc de proves CoolerMaster V1.0
Monitor NEC EA244UHD
Sistema operatiu Windows 10 Pro x64
Programari GPU NVIDIA
NVIDIA GeForce RTX 20 Controlador NVIDIA GeForce Game Ready 419.67
NVIDIA GeForce GTX 10/16 Controlador NVIDIA GeForce Game Ready 425.31
Proves de joc
Игра API Configuració, mètode de prova Antialiasing de pantalla completa
1920×1080 / 2560×1440 3840 × 2160
Battlefield V DirectX 12 OCAT, missió Llibertat. Màx. qualitat dels gràfics TAA Alta TAA Alta
metre Èxode DirectX 12 Referent integrat. Perfil de qualitat ultra gràfica TAA TAA
L'ombra del Tomb Raider DirectX 12 Referent integrat. Màx. qualitat dels gràfics SMAA 4x Desactivat

Els indicadors de velocitats de fotogrames mitjanes i mínimes es deriven de la matriu de temps de representació de fotogrames individuals, que es registra mitjançant el punt de referència integrat (Metro Exodus, Shadow of the Tomb Raider) o la utilitat OCAT, si el joc no en té cap. (camp de batalla V).

La velocitat mitjana de fotogrames als gràfics és la inversa del temps mitjà de fotograma. Per estimar la velocitat de fotogrames mínima, es calcula el nombre de fotogrames formats en cada segon de la prova. D'aquesta matriu de nombres, es selecciona el valor corresponent al percentil 1 de la distribució.

Participants de la prova

Les següents targetes de vídeo van participar en les proves de rendiment:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 MHz, 11 GB);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Battlefield V

A causa del fet que el mateix Battlefield V és un joc bastant lleuger (sobretot en els modes 1080p i 1440p) i utilitza traçat de raigs en pegats, provar la sèrie GeForce 10 amb l'opció DXR va donar resultats encoratjadors. Tanmateix, de tots els models sense suport de Ray Tracing a nivell de silici, vam haver de limitar-nos als models GTX 1070/1070 Ti i GTX 1080/1080 Ti. Els jocs d'Electronic Arts reaccionen amb sospita als canvis freqüents en la configuració del maquinari i bloquegen l'usuari durant un període d'un o diversos dies. Per tant, les mesures de rendiment de la GeForce GTX 1060 i dos dispositius de la sèrie GeForce GTX 16 apareixeran en aquest article més endavant, tan bon punt Battlefield V elimini les restriccions de la nostra màquina de prova.

En termes percentuals, qualsevol dels participants de la prova va experimentar aproximadament la mateixa caiguda del rendiment en diversos paràmetres de qualitat de traçat de raigs, independentment de la resolució de la pantalla. Així, el rendiment de les targetes de vídeo de la marca GeForce RTX 20 disminueix entre un 28 i un 43% amb efectes DXR de baixa i mitjana qualitat i un 37–53% amb una qualitat alta i màxima.

Si parlem de models més antics de la família GeForce 10, als nivells de traçat de raigs baix i mitjà el joc perd del 36 al 42% dels FPS, i en alta qualitat (configuració alta i ultra), DXR ja menja 54-67. % de la velocitat de fotogrames. Tingueu en compte que en moltes, si no en la majoria, les escenes de jocs de Battlefield V no hi ha cap diferència perceptible entre els paràmetres Baix i Mitjà, ni entre Alt i Ultra, en termes de claredat o rendiment de la imatge. Amb l'esperança que les GPU Pascal fossin més sensibles a aquesta configuració, vam fer proves a les quatre configuracions. De fet, van aparèixer certes diferències, però només amb una resolució de 2160p i dins del 6% de FPS.

En termes absoluts, qualsevol dels acceleradors més antics dels xips Pascal pot mantenir velocitats de fotogrames per sobre de 60 FPS en mode 1080p amb una qualitat de reflexió reduïda, i la GeForce GTX 1080 Ti reclama un resultat similar fins i tot quan es traça a nivell alt. Però una vegada que passeu a la resolució de 1440p, només les GeForce GTX 1080 i GTX 1080 Ti proporcionen una còmoda velocitat de fotogrames de 60 FPS o superior amb una qualitat de traçat de raigs baixa o mitjana, i en mode 4K, cap de les targetes de la generació anterior té una potència informàtica adequada ( com, de fet, qualsevol Turing amb l'excepció del vaixell insígnia GeForce RTX 2080 Ti).

Si busquem paral·lelismes entre acceleradors específics de les marques GeForce GTX 10 i GeForce RTX 20, aleshores el millor model de la generació anterior (GeForce GTX 1080 Ti), que és un anàleg de la GeForce RTX 2080 en tasques de renderització estàndard sense DXR, va baixar al nivell de la GeForce RTX 2070 amb un traçat de raigs de qualitat reduïda i, a nivells alts, només pot lluitar amb la GeForce RTX 2060.

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Battlefield V, màx. Qualitat
1920×1080 TAA
RT apagat RT Baix RT Mitjà RT alt RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Battlefield V, màx. Qualitat
2560×1440 TAA
RT apagat RT Baix RT Mitjà RT alt RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Nou article: GeForce RTX ja no es necessita? Proves de traçat de raigs en acceleradors GeForce GTX 10 i 16

Battlefield V, màx. Qualitat
3840×2160 TAA
RT apagat RT Baix RT Mitjà RT alt RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 GB) 100% ND ND ND ND

Font: 3dnews.ru

Afegeix comentari