Sammen med den nye processorkerne
ARM erklærer en betydelig stigning i grafikydeevnen for Mali-G77 - med 40% sammenlignet med den nuværende generation af Mali-G76. Dette blev opnået både gennem den tekniske proces og arkitektoniske forbedringer. Mali-G77 kan have fra 7 til 16 kerner (skalering fra 1 til 32 er mulig i fremtiden), og hver af dem har næsten samme størrelse som G76. Derfor vil avancerede smartphones sandsynligvis have det samme antal GPU-kerner.
I spil kan du forvente ydeevneforbedringer på mellem 20 og 40 %, afhængigt af typen af grafikbelastning. At dømme efter resultaterne af den populære Manhattan GFXBench-test vil den nye GPU's betydelige overlegenhed i forhold til den nuværende generation tvinge rivalen Qualcomm til at bekymre sig om en væsentlig forbedring af Adrenos grafikydeevne.
I sig selv leverer den nye Mali-G77-arkitektur en gennemsnitlig forbedring på 30 procent i strømeffektivitet eller ydeevne, siger ARM. Anden generation af ARM Valhall skalararkitektur tillader GPU'en at udføre 16 instruktioner pr. cyklus parallelt på CU'en sammenlignet med otte i Bifrost (Mali-G76). Andre innovationer omfatter fuldt hardware-drevet dynamisk instruktionsplanlægning og et helt nyt instruktionssæt, samtidig med at den bibeholder bagudkompatibilitet med Bifrost. Understøttelse af ARM AFBC1.3-komprimeringsformatet og andre innovationer (FP16-gengivelsesmål, lagdelt gengivelse og vertex shader-output) er også blevet tilføjet.
Bifrost CU indeholdt 3 udførelsesmotorer, som hver inkluderede en instruktionscache, et register og en Warp-kontrolenhed. Fordeling på tværs af disse tre motorer gjorde det muligt at udføre 24 FMA-instruktioner med 32-bit floating point-præcision (FP32). I Valhall har hver CU kun én eksekveringsmotor, opdelt mellem to computerenheder, der er i stand til at behandle 16 Warp-instruktioner pr. ur, hvilket resulterer i en samlet gennemstrømning på 32 FMA FP32-instruktioner pr. CU. Takket være disse arkitektoniske ændringer kan Mali-G77 udføre en tredjedel flere matematiske beregninger i parallelle beregninger sammenlignet med Mali-G76.
Derudover indeholder hver af disse CU'er to nye matematiske funktionsblokke. Den nye konverteringsmotor (CVT) håndterer grundlæggende heltal-, logiske-, gren- og konverteringsinstruktioner. Special Function Unit (SFU) fremskynder heltalsmultiplikation, division, kvadratrod, logaritmer og andre komplekse heltalsfunktioner.
Standard FMA-blokken har flere indstillinger, der understøtter 16 FP32-instruktioner pr. cyklus, 32 for FP16 eller 64 for INT8 Dot-produkt. Disse optimeringer kan give op til 60 % præstationsforbedringer i maskinlæringsapplikationer.
En anden vigtig ændring i Mali-G77 er fordoblingen af teksturmotorens ydeevne, som nu behandler 4 bilineære texel pr. ur sammenlignet med de to foregående, 2 trilineære texel pr. ur, hvilket muliggør hurtigere FP16- og FP32-filtrering.
ARM har foretaget en række andre ændringer, hvor Mali-G77 og Valhall lover betydelige præstationsforbedringer for spil- og maskinlærings-arbejdsbelastninger. Det er vigtigt, at strømforbruget og chipområdet holdes på Bifrost-niveauer, hvilket lover mobile enheder med højere topydelse uden at øge strømforbruget, varmeafledning og størrelseskrav.
Kilde: 3dnews.ru