NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

NVIDIA presentou a nova xeración de tarxetas gráficas para xogos Ampere o 1 de setembro, pero a presentación inicial case non contiña detalles técnicos. Agora, uns días despois, a compañía publicou documentación que aclara de onde procede a impresionante vantaxe de rendemento que distingue as tarxetas gráficas da serie GeForce RTX 30 das súas predecesoras.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Moitos notaron inmediatamente que as especificacións oficiais das GeForce RTX 3090, GeForce RTX 3080 e GeForce RTX 3070 no sitio web de NVIDIA indicaban un número asombroso de procesadores CUDA.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Ao parecer, a duplicación do rendemento FP32 dos procesadores de xogos Ampere en comparación con Turing realmente ocorre, e está asociada a un cambio na arquitectura dos bloques de construción básicos da GPU: procesadores de fluxo (SM).

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Mentres que os SM das GPU da xeración Turing tiñan un camiño computacional para operacións de punto flotante, en Ampere cada procesador de fluxo recibiu dous camiños, que en total poden realizar ata 128 operacións FMA por ciclo de reloxo fronte a 64 de Turing. Ao mesmo tempo, a metade das unidades de execución Ampere dispoñibles son capaces de realizar tanto operacións enteiras (INT) como operacións de coma flotante de 32 bits (FP32), mentres que a segunda metade dos dispositivos está destinada exclusivamente a operacións FP32. Este enfoque utilizouse para aforrar o orzamento do transistor, baseándose no feito de que a carga de xogo xera significativamente máis operacións FP32 que INT. Non obstante, en Turing non había actuadores combinados.


NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Ao mesmo tempo, para proporcionar aos procesadores de fluxo mellorados a cantidade necesaria de datos, NVIDIA aumentou nun terzo o tamaño da caché L1 en SM (de 96 a 128 KB) e tamén duplicou o seu rendemento.

Outra mellora importante en Ampere é que os núcleos CUDA, RT e Tensor agora poden funcionar totalmente en paralelo. Isto permite que o motor gráfico, por exemplo, use DLSS para escalar un cadro e, ao mesmo tempo, calcule o seguinte cadro nos núcleos CUDA e RT, reducindo o tempo de inactividade dos nodos funcionais e aumentando o rendemento xeral.

A isto hai que engadir que os núcleos de RT de segunda xeración, que están implementados en Amrere, poden calcular interseccións de triángulos con raios o dobre de rápido que o de Turing. E os novos núcleos tensores de terceira xeración duplicaron o rendemento matemático ao traballar con matrices escasas.

Duplicar a velocidade á que Ampere calcula as interseccións do triángulo debería ter un impacto significativo no rendemento dos aceleradores da serie GeForce RTX 30 en xogos que admiten o trazado de raios. Segundo NVIDIA, foi esta característica a que actuou como un pescozo de botella na arquitectura de Turing, mentres que a velocidade de cálculo das interseccións de raios de paralelepípedos delimitadores non suscitaron queixas. Agora optimizouse o equilibrio do rendemento no trazado e, ademais, en Ampere pódense realizar ambos os tipos de operacións de raios (con triángulos e paralelepípedos) en paralelo.

Ademais disto, engadiuse unha nova funcionalidade aos núcleos RT de Ampere para interpolar a posición dos triángulos. Pódese usar para difuminar obxectos en movemento cando non todos os triángulos da escena están nunha posición constante.

Para ilustrar todo isto, NVIDIA mostrou unha comparación directa de como as GPU Turing e Ampere manexan o trazado de raios en Wolfenstein Youngblood con resolución 4K. Como se desprende da ilustración presentada, Ampere beneficia notablemente na velocidade de construción do cadro tanto debido aos cálculos matemáticos FP32 máis rápidos, grazas aos núcleos RT de segunda xeración, como ao funcionamento paralelo de recursos GPU heteroxéneos.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Ademais, para reforzar practicamente o anterior, NVIDIA presentou resultados de proba adicionais para as GeForce RTX 3090, GeForce RTX 3080 e GeForce RTX 3070. Segundo eles, a GeForce RTX 3070 está aproximadamente un 60% por diante da GeForce RTX 2070 en resolución 1440p, e esta imaxe obsérvase en xogos con soporte RTX e con rasterización tradicional, en particular en Borderlands 3.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

O rendemento da GeForce RTX 3080 é dúas veces máis bo que o da GeForce RTX 2080 con resolución 4K. É certo, neste caso, en Borderlands 3 sen soporte RTX, a vantaxe da nova tarxeta non é o dobre, senón aproximadamente o 80 por cento.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

E a tarxeta máis antiga, GeForce RTX 3090, nas propias probas de NVIDIA mostra unha vantaxe de aproximadamente unha vez e media sobre o Titan RTX.

NVIDIA explicou por que os aceleradores da serie GeForce RTX 30 teñen tal salto no rendemento

Segundo informes de xornalistas tecnolóxicos, as revisións completas do deseño de referencia GeForce RTX 3080 publicaranse o 14 de setembro. Tres días despois, o 17 de setembro, permitirase publicar datos de proba dos modelos GeForce RTX 3080 de produción dos socios da compañía. Así, queda moi pouco tempo para esperar a que aparezan en Internet os resultados das probas independentes dos representantes da serie GeForce RTX 30.

Fonte:



Fonte: 3dnews.ru

Engadir un comentario