NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

NVIDIA presentó la nueva generación de tarjetas gráficas para juegos Ampere el 1 de septiembre, pero la presentación inicial casi no contenía detalles técnicos. Ahora, unos días después, la compañía ha publicado documentación que aclara de dónde proviene la impresionante ventaja de rendimiento que distingue a las tarjetas gráficas GeForce RTX serie 30 de sus predecesoras.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Muchos notaron de inmediato que las especificaciones oficiales de GeForce RTX 3090, GeForce RTX 3080 y GeForce RTX 3070 en el sitio web de NVIDIA indicaban una cantidad asombrosamente grande de procesadores CUDA.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Resulta que la duplicación del rendimiento FP32 de los procesadores de juegos Ampere en comparación con Turing efectivamente ocurre, y está asociado con un cambio en la arquitectura de los componentes básicos de la GPU: los procesadores de flujo (SM).

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Mientras que los SM en las GPU de la generación Turing tenían una ruta computacional para operaciones de punto flotante, en Ampere cada procesador de flujo recibió dos rutas, que en total pueden realizar hasta 128 operaciones FMA por ciclo de reloj versus 64 para Turing. Al mismo tiempo, la mitad de las unidades de ejecución Ampere disponibles son capaces de realizar operaciones tanto de números enteros (INT) como de coma flotante de 32 bits (FP32), mientras que la segunda mitad de los dispositivos están destinadas exclusivamente a operaciones FP32. Este enfoque se utilizó para ahorrar el presupuesto del transistor, basándose en el hecho de que la carga del juego genera significativamente más operaciones FP32 que INT. Sin embargo, en Turing no existía ningún actuador combinado.


NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Al mismo tiempo, para proporcionar a los procesadores de flujo mejorados la cantidad de datos necesaria, NVIDIA aumentó el tamaño de la caché L1 en SM en un tercio (de 96 a 128 KB) y también duplicó su rendimiento.

Otra mejora importante en Ampere es que los núcleos CUDA, RT y Tensor ahora pueden funcionar completamente en paralelo. Esto permite que el motor gráfico, por ejemplo, use DLSS para escalar un cuadro y, al mismo tiempo, calcular el siguiente cuadro en los núcleos CUDA y RT, lo que reduce el tiempo de inactividad de los nodos funcionales y aumenta el rendimiento general.

A esto hay que sumar que los núcleos RT de segunda generación, que se implementan en Amrere, pueden calcular intersecciones de triángulos con rayos dos veces más rápido que lo que ocurría en Turing. Y los nuevos núcleos tensoriales de tercera generación han duplicado el rendimiento matemático cuando se trabaja con matrices dispersas.

Duplicar la velocidad a la que Ampere calcula las intersecciones de triángulos debería tener un impacto significativo en el rendimiento de los aceleradores GeForce RTX serie 30 en juegos que admiten el trazado de rayos. Según NVIDIA, fue esta característica la que actuó como un cuello de botella en la arquitectura de Turing, mientras que la velocidad de cálculo de las intersecciones de rayos de paralelepípedos delimitadores no generó ninguna queja. Ahora se ha optimizado el equilibrio de rendimiento en el trazado y, además, en Ampere, ambos tipos de operaciones de rayos (con triángulos y paralelepípedos) se pueden realizar en paralelo.

Además de esto, se ha añadido una nueva funcionalidad a los núcleos RT de Ampere para interpolar la posición de los triángulos. Esto se puede utilizar para desenfocar objetos en movimiento cuando no todos los triángulos de la escena están en una posición constante.

Para ilustrar todo esto, NVIDIA mostró una comparación directa de cómo las GPU Turing y Ampere manejan el trazado de rayos en Wolfenstein Youngblood en resolución 4K. Como se desprende de la ilustración presentada, Ampere se beneficia notablemente en la velocidad de construcción del cuadro debido a cálculos matemáticos FP32 más rápidos, gracias a los núcleos RT de segunda generación, así como al funcionamiento paralelo de recursos heterogéneos de GPU.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Además, para reforzar prácticamente lo anterior, NVIDIA presentó resultados de pruebas adicionales para las GeForce RTX 3090, GeForce RTX 3080 y GeForce RTX 3070. Según ellos, la GeForce RTX 3070 está aproximadamente un 60% por delante de la GeForce RTX 2070 en una resolución de 1440p. Y esta imagen se observa en juegos con soporte RTX y con rasterización tradicional, en particular en Borderlands 3.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

El rendimiento de la GeForce RTX 3080 es dos veces mejor que el de la GeForce RTX 2080 con una resolución de 4K. Es cierto que en este caso, en Borderlands 3 sin soporte RTX, la ventaja de la nueva tarjeta no es el doble, sino aproximadamente el 80 por ciento.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Y la tarjeta más antigua, GeForce RTX 3090, en las propias pruebas de NVIDIA muestra aproximadamente una ventaja de una vez y media sobre la Titan RTX.

NVIDIA explicó por qué los aceleradores GeForce RTX serie 30 tienen tal salto de rendimiento

Según informes de periodistas tecnológicos, las revisiones completas del diseño de referencia de la GeForce RTX 3080 se publicarán el 14 de septiembre. Tres días después, el 17 de septiembre, se permitirá publicar datos de prueba para los modelos de producción GeForce RTX 3080 de los socios de la compañía. Por lo tanto, queda muy poco tiempo para esperar a que aparezcan en Internet los resultados de las pruebas independientes de los representantes de la serie GeForce RTX 30.

Fuente:



Fuente: 3dnews.ru

Añadir un comentario