ARM Mali-G77 GPU er 40 % raskere

Sammen med den nye prosessorkjernen Cortex-A77 ARM introduserte en grafikkprosessor designet for neste generasjons mobile enkeltbrikkesystemer. Mali-G77, som ikke må forveksles med den nye skjermprosessoren Mali-D77, markerer overgangen fra ARM Bifrost-arkitekturen til Valhall.

ARM Mali-G77 GPU er 40 % raskere

ARM erklærer en betydelig økning i grafikkytelsen til Mali-G77 – med 40 % sammenlignet med den nåværende generasjonen av Mali-G76. Dette ble oppnådd både gjennom den tekniske prosessen og arkitektoniske forbedringer. Mali-G77 kan ha fra 7 til 16 kjerner (skalering fra 1 til 32 er mulig i fremtiden), og hver av dem har nesten samme størrelse som G76. Følgelig vil avanserte smarttelefoner sannsynligvis ha samme antall GPU-kjerner.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

I spill kan du forvente ytelsesforbedringer på mellom 20 og 40 %, avhengig av typen grafikkarbeid. Å dømme etter resultatene fra den populære Manhattan GFXBench-testen, vil den betydelige overlegenheten til den nye GPUen i forhold til den nåværende generasjonen tvinge rivalen Qualcomm til å bekymre seg for en betydelig forbedring i Adreno-grafikkytelsen.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

I seg selv leverer den nye Mali-G77-arkitekturen en gjennomsnittlig 30 prosent forbedring i strømeffektivitet eller ytelse, sier ARM. Den andre generasjonen av ARM Valhall skalararkitektur lar GPUen utføre 16 instruksjoner per syklus parallelt på CU, sammenlignet med åtte i Bifrost (Mali-G76). Andre innovasjoner inkluderer fullstendig maskinvaredrevet dynamisk instruksjonsplanlegging og et helt nytt instruksjonssett samtidig som bakoverkompatibilitet med Bifrost opprettholdes. Støtte for ARM AFBC1.3-komprimeringsformatet og andre innovasjoner (FP16-gjengivelsesmål, lagdelt gjengivelse og vertex shader-utganger) er også lagt til.


ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

Bifrost CU inneholdt 3 utførelsesmotorer, som hver inkluderte en instruksjonsbuffer, et register og en Warp-kontrollenhet. Distribusjon på tvers av disse tre motorene gjorde at 24 FMA-instruksjoner kunne utføres med 32-bits flytepunktpresisjon (FP32). I Valhall har hver CU bare én utførelsesmotor, delt mellom to beregningsenheter som er i stand til å behandle 16 Warp-instruksjoner per klokke, noe som resulterer i en total gjennomstrømning på 32 FMA FP32-instruksjoner per CU. Takket være disse arkitektoniske endringene kan Mali-G77 utføre en tredjedel flere matematiske beregninger i parallelle beregninger sammenlignet med Mali-G76.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

I tillegg inneholder hver av disse CU-ene to nye matematiske funksjonsblokker. Den nye konverteringsmotoren (CVT) håndterer grunnleggende heltalls-, logiske-, gren- og konverteringsinstruksjoner. Special Function Unit (SFU) øker hastigheten på heltallsmultiplikasjon, divisjon, kvadratrot, logaritmer og andre komplekse heltallsfunksjoner.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

Standard FMA-blokken har flere innstillinger som støtter 16 FP32-instruksjoner per syklus, 32 for FP16 eller 64 for INT8 Dot Product. Disse optimaliseringene kan gi opptil 60 % ytelsesforbedringer i maskinlæringsapplikasjoner.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

En annen viktig endring i Mali-G77 er doblingen av teksturmotorens ytelse, som nå behandler 4 bilineære texel per klokke sammenlignet med de to foregående, 2 trilineære texel per klokke, noe som muliggjør raskere FP16- og FP32-filtrering.

ARM Mali-G77 GPU er 40 % raskere

ARM Mali-G77 GPU er 40 % raskere

ARM har gjort en rekke andre endringer, med Mali-G77 og Valhall som lover betydelige ytelsesforbedringer for spill- og maskinlæringsarbeid. Viktigere er at strømforbruket og brikkeområdet holdes på Bifrost-nivåer, noe som lover mobile enheter med høyere toppytelse uten å øke strømforbruket, varmespredningen og størrelseskravene.



Kilde: 3dnews.ru

Legg til en kommentar