Sammen med den nye prosessorkjernen
ARM erklærer en betydelig økning i grafikkytelsen til Mali-G77 – med 40 % sammenlignet med den nåværende generasjonen av Mali-G76. Dette ble oppnådd både gjennom den tekniske prosessen og arkitektoniske forbedringer. Mali-G77 kan ha fra 7 til 16 kjerner (skalering fra 1 til 32 er mulig i fremtiden), og hver av dem har nesten samme størrelse som G76. Følgelig vil avanserte smarttelefoner sannsynligvis ha samme antall GPU-kjerner.
I spill kan du forvente ytelsesforbedringer på mellom 20 og 40 %, avhengig av typen grafikkarbeid. Å dømme etter resultatene fra den populære Manhattan GFXBench-testen, vil den betydelige overlegenheten til den nye GPUen i forhold til den nåværende generasjonen tvinge rivalen Qualcomm til å bekymre seg for en betydelig forbedring i Adreno-grafikkytelsen.
I seg selv leverer den nye Mali-G77-arkitekturen en gjennomsnittlig 30 prosent forbedring i strømeffektivitet eller ytelse, sier ARM. Den andre generasjonen av ARM Valhall skalararkitektur lar GPUen utføre 16 instruksjoner per syklus parallelt på CU, sammenlignet med åtte i Bifrost (Mali-G76). Andre innovasjoner inkluderer fullstendig maskinvaredrevet dynamisk instruksjonsplanlegging og et helt nytt instruksjonssett samtidig som bakoverkompatibilitet med Bifrost opprettholdes. Støtte for ARM AFBC1.3-komprimeringsformatet og andre innovasjoner (FP16-gjengivelsesmål, lagdelt gjengivelse og vertex shader-utganger) er også lagt til.
Bifrost CU inneholdt 3 utførelsesmotorer, som hver inkluderte en instruksjonsbuffer, et register og en Warp-kontrollenhet. Distribusjon på tvers av disse tre motorene gjorde at 24 FMA-instruksjoner kunne utføres med 32-bits flytepunktpresisjon (FP32). I Valhall har hver CU bare én utførelsesmotor, delt mellom to beregningsenheter som er i stand til å behandle 16 Warp-instruksjoner per klokke, noe som resulterer i en total gjennomstrømning på 32 FMA FP32-instruksjoner per CU. Takket være disse arkitektoniske endringene kan Mali-G77 utføre en tredjedel flere matematiske beregninger i parallelle beregninger sammenlignet med Mali-G76.
I tillegg inneholder hver av disse CU-ene to nye matematiske funksjonsblokker. Den nye konverteringsmotoren (CVT) håndterer grunnleggende heltalls-, logiske-, gren- og konverteringsinstruksjoner. Special Function Unit (SFU) øker hastigheten på heltallsmultiplikasjon, divisjon, kvadratrot, logaritmer og andre komplekse heltallsfunksjoner.
Standard FMA-blokken har flere innstillinger som støtter 16 FP32-instruksjoner per syklus, 32 for FP16 eller 64 for INT8 Dot Product. Disse optimaliseringene kan gi opptil 60 % ytelsesforbedringer i maskinlæringsapplikasjoner.
En annen viktig endring i Mali-G77 er doblingen av teksturmotorens ytelse, som nå behandler 4 bilineære texel per klokke sammenlignet med de to foregående, 2 trilineære texel per klokke, noe som muliggjør raskere FP16- og FP32-filtrering.
ARM har gjort en rekke andre endringer, med Mali-G77 og Valhall som lover betydelige ytelsesforbedringer for spill- og maskinlæringsarbeid. Viktigere er at strømforbruket og brikkeområdet holdes på Bifrost-nivåer, noe som lover mobile enheter med høyere toppytelse uten å øke strømforbruket, varmespredningen og størrelseskravene.
Kilde: 3dnews.ru