ARM Mali-G77 GPU is 40% sneller

Samen met de nieuwe processorkern Cortex-A77 ARM introduceerde een grafische processor die is ontworpen voor de volgende generatie mobiele systemen met één chip. Mali-G77, die niet moet worden verward met de nieuwe displayprocessor Mali-D77, markeert de overgang van de ARM Bifrost-architectuur naar Valhall.

ARM Mali-G77 GPU is 40% sneller

ARM meldt een aanzienlijke toename van de grafische prestaties van de Mali-G77 - met 40% vergeleken met de huidige generatie Mali-G76. Dit werd bereikt door zowel het technische proces als architectonische verbeteringen. De Mali-G77 kan 7 tot 16 kernen hebben (opschalen van 1 naar 32 is in de toekomst mogelijk), en elk daarvan heeft bijna dezelfde grootte als de G76. Bijgevolg zullen high-end smartphones waarschijnlijk hetzelfde aantal GPU-kernen hebben.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

In games kun je prestatieverbeteringen verwachten van tussen de 20 en 40%, afhankelijk van het type grafische werklast. Afgaande op de resultaten van de populaire Manhattan GFXBench-test zal de aanzienlijke superioriteit van de nieuwe GPU ten opzichte van de huidige generatie rivaal Qualcomm dwingen zich zorgen te maken over een aanzienlijke verbetering van de grafische prestaties van Adreno.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

Op zichzelf levert de nieuwe Mali-G77-architectuur een gemiddelde verbetering van 30 procent op in energie-efficiëntie of prestaties, zegt ARM. Dankzij de tweede generatie ARM Valhall-scalaire architectuur kan de GPU 16 instructies per cyclus parallel uitvoeren op de CU, vergeleken met acht in de Bifrost (Mali-G76). Andere innovaties zijn onder meer een volledig hardwaregestuurde dynamische instructieplanning en een volledig nieuwe instructieset, terwijl de achterwaartse compatibiliteit met Bifrost behouden blijft. Ondersteuning voor het ARM AFBC1.3-compressieformaat en andere innovaties (FP16-weergavedoelen, gelaagde weergave en vertex-shader-uitvoer) zijn ook toegevoegd.


ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

De Bifrost CU bevatte 3 uitvoeringsmotoren, die elk een instructiecache, een register en een Warp-besturingseenheid bevatten. Door de verdeling over deze drie motoren konden 24 FMA-instructies worden uitgevoerd met een drijvende-kommaprecisie van 32 bits (FP32). In Valhall heeft elke CU slechts één uitvoeringsengine, verdeeld over twee rekeneenheden die 16 Warp-instructies per klok kunnen verwerken, wat resulteert in een totale doorvoer van 32 FMA FP32-instructies per CU. Dankzij deze architectonische veranderingen kan Mali-G77 een derde meer wiskundige berekeningen uitvoeren in parallelle berekeningen vergeleken met Mali-G76.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

Bovendien bevat elk van deze CU's twee nieuwe wiskundige functieblokken. De nieuwe conversie-engine (CVT) verwerkt basisinstructies voor gehele getallen, logische, vertakkingen en conversies. De Special Function Unit (SFU) versnelt het vermenigvuldigen, delen, worteltrekken, logaritmen en andere complexe gehele getallenfuncties van gehele getallen.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

Het standaard FMA-blok heeft verschillende instellingen die 16 FP32-instructies per cyclus ondersteunen, 32 voor FP16 of 64 voor INT8 Dot Product. Deze optimalisaties kunnen tot 60% prestatieverbeteringen opleveren in machine learning-toepassingen.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

Een andere belangrijke verandering in de Mali-G77 is de verdubbeling van de prestaties van de texture engine, die nu 4 bilineaire texels per klok verwerkt in vergelijking met de vorige twee, 2 trilineaire texels per klok, waardoor snellere FP16- en FP32-filtering mogelijk is.

ARM Mali-G77 GPU is 40% sneller

ARM Mali-G77 GPU is 40% sneller

ARM heeft nog een aantal andere wijzigingen aangebracht, waarbij de Mali-G77 en Valhall aanzienlijke prestatieverbeteringen beloven voor gaming- en machine learning-workloads. Belangrijk is dat het stroomverbruik en het chipoppervlak op Bifrost-niveaus worden gehouden, wat mobiele apparaten belooft met hogere piekprestaties zonder dat het stroomverbruik, de warmteafvoer en de afmetingen toenemen.



Bron: 3dnews.ru

Voeg een reactie