La GPU ARM Mali-G77 és un 40% més ràpida

Juntament amb el nou nucli del processador Cortex-A77 ARM va presentar un processador gràfic dissenyat per a sistemes mòbils d'un sol xip de nova generació. Mali-G77, que no s'ha de confondre amb el nou processador de pantalla Mali-D77, marca la transició de l'arquitectura ARM Bifrost a Valhall.

La GPU ARM Mali-G77 és un 40% més ràpida

ARM declara un augment significatiu del rendiment gràfic del Mali-G77, un 40% en comparació amb la generació actual del Mali-G76. Això es va aconseguir tant mitjançant el procés tècnic com les millores arquitectòniques. El Mali-G77 pot tenir de 7 a 16 nuclis (en el futur és possible escalar d'1 a 32), i cadascun d'ells té gairebé la mateixa mida que el G76. En conseqüència, els telèfons intel·ligents de gamma alta probablement inclouran el mateix nombre de nuclis de GPU.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

Als jocs, podeu esperar millores de rendiment d'entre un 20 i un 40%, depenent del tipus de càrrega de treball gràfica. A jutjar pels resultats de la popular prova Manhattan GFXBench, la superioritat significativa de la nova GPU respecte a la generació actual obligarà al rival Qualcomm a preocupar-se per una millora significativa en el rendiment gràfic d'Adreno.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

Per si sola, la nova arquitectura Mali-G77 ofereix una millora mitjana del 30% en l'eficiència energètica o el rendiment, diu ARM. La segona generació de l'arquitectura escalar ARM Valhall permet que la GPU executi 16 instruccions per cicle en paral·lel a la CU, en comparació amb les vuit del Bifrost (Mali-G76). Altres innovacions inclouen una programació d'instruccions dinàmiques totalment impulsada pel maquinari i un conjunt d'instruccions completament nou mantenint la compatibilitat amb Bifrost. També s'ha afegit suport per al format de compressió ARM AFBC1.3 i altres innovacions (objectius de renderització FP16, representació en capes i sortides d'ombrejat de vèrtex).


La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

El Bifrost CU contenia 3 motors d'execució, cadascun dels quals incloïa una memòria cau d'instruccions, un registre i una unitat de control Warp. La distribució entre aquests tres motors va permetre executar 24 instruccions FMA amb precisió de coma flotant de 32 bits (FP32). A Valhall, cada CU només té un motor d'execució, dividit entre dues unitats de càlcul capaços de processar 16 instruccions Warp per rellotge, el que resulta en un rendiment total de 32 instruccions FMA FP32 per CU. Gràcies a aquests canvis arquitectònics, Mali-G77 pot realitzar un terç més de càlculs matemàtics en càlculs paral·lels en comparació amb Mali-G76.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

A més, cadascun d'aquests CU conté dos nous blocs de funcions matemàtiques. El nou motor de conversió (CVT) gestiona instruccions bàsiques d'enter, lògic, de branca i de conversió. La Unitat de Funcions Especials (SFU) accelera la multiplicació, la divisió, l'arrel quadrada, els logaritmes i altres funcions complexes de nombres enters.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

El bloc FMA estàndard té diversos paràmetres que admeten 16 instruccions FP32 per cicle, 32 per a FP16 o 64 per a INT8 Dot Product. Aquestes optimitzacions poden oferir fins a un 60% de millores de rendiment a les aplicacions d'aprenentatge automàtic.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

Un altre canvi clau en el Mali-G77 és la duplicació del rendiment del motor de textures, que ara processa 4 texels bilineals per rellotge en comparació amb els dos anteriors, 2 texels trilineals per rellotge, permetent un filtratge FP16 i FP32 més ràpid.

La GPU ARM Mali-G77 és un 40% més ràpida

La GPU ARM Mali-G77 és un 40% més ràpida

ARM ha fet una sèrie d'altres canvis, amb el Mali-G77 i el Valhall prometent millores significatives de rendiment per a les càrregues de treball de jocs i aprenentatge automàtic. És important destacar que el consum d'energia i l'àrea del xip es mantenen als nivells de Bifrost, la qual cosa promet dispositius mòbils amb un rendiment màxim superior sense augmentar el consum d'energia, la dissipació de calor i els requisits de mida.



Font: 3dnews.ru

Afegeix comentari