Junto con el nuevo núcleo del procesador
ARM declara un aumento significativo en el rendimiento de gráficos Mali-G77: 40% en comparación con la generación actual de Mali-G76. Esto se ha logrado a través de la tecnología de procesos y mejoras arquitectónicas. Mali-G77 puede tener de 7 a 16 núcleos (es posible escalar de 1 a 32 en el futuro), con cada uno de ellos casi del mismo tamaño que el G76. Por lo tanto, es probable que los teléfonos inteligentes de gama alta estén equipados con la misma cantidad de núcleos de GPU.
En los juegos, puede esperar mejoras de rendimiento de entre un 20 % y un 40 %, según el tipo de carga de trabajo de gráficos. A juzgar por los resultados de la popular prueba Manhattan GFXBench, la significativa superioridad de la nueva GPU sobre la generación actual obligará a su rival Qualcomm a prestar atención a una mejora significativa en el rendimiento de los gráficos Adreno.
Por sí sola, la nueva arquitectura Mali-G77 proporciona una mejora promedio del 30 por ciento en la eficiencia energética o el rendimiento, según ARM. La segunda generación de la arquitectura escalar de ARM Valhall permite que la GPU ejecute 16 instrucciones por ciclo en paralelo por CU, en comparación con las ocho de Bifrost (Mali-G76). Otras innovaciones incluyen la programación de instrucciones dinámicas totalmente impulsadas por hardware y un conjunto de instrucciones completamente nuevo, manteniendo la compatibilidad con versiones anteriores de Bifrost. También se agregó soporte para el formato de compresión ARM AFBC1.3 y otras innovaciones (objetivos de renderizado FP16, renderizado en capas y salidas de sombreado de vértices).
El Bifrost CU contenía 3 motores de ejecución de instrucciones, cada uno de los cuales incluía un caché de instrucciones, un registro y una unidad de control Warp. La distribución en estos tres motores permitió que se ejecutaran 24 instrucciones FMA con precisión de coma flotante de 32 bits (FP32). En Valhall, cada CU tiene solo un motor de ejecución de comandos, dividido entre dos módulos de cómputo capaces de procesar 16 instrucciones Warp por reloj, es decir, se proporciona un rendimiento total de 32 instrucciones FMA FP32 por CU. Gracias a estos cambios en la arquitectura, el Mali-G77 puede realizar hasta un tercio más de cálculos matemáticos en cálculos paralelos en comparación con el Mali-G76.
Además, cada una de estas CU contiene dos nuevos bloques de funciones matemáticas. El nuevo módulo de conversión (CVT) maneja instrucciones básicas de conversión de enteros, booleanos, ramas y. El bloque de función especial (SFU) acelera la multiplicación, división, raíz cuadrada, logaritmos y otras funciones enteras complejas.
Hay varias configuraciones en el bloque FMA estándar que admiten 16 instrucciones FP32 por ciclo, 32 - FP16 o 64 - INT8 Dot Product. Estas optimizaciones pueden proporcionar mejoras de rendimiento de hasta un 60 % en aplicaciones de aprendizaje automático.
Otro cambio clave en el Mali-G77 es la duplicación del rendimiento del motor de texturas, que ahora procesa 4 texels bilineales por reloj en comparación con los dos anteriores, 2 texels trilineales por reloj, lo que permite un filtrado más rápido de FP16 y FP32.
ARM también ha realizado una serie de otros cambios, lo que ha dado como resultado que Mali-G77 y Valhall prometan mejoras significativas en el rendimiento de las cargas de trabajo de juegos y aprendizaje automático. Es importante tener en cuenta que el consumo de energía y el área del chip se mantienen en los niveles de Bifrost, lo que promete dispositivos móviles con un rendimiento máximo más alto sin aumentar los requisitos de consumo de energía, disipación de calor y tamaño.
Fuente: 3dnews.ru