Saam met die nuwe verwerkerkern
ARM verklaar 'n aansienlike toename in grafiese werkverrigting van die Mali-G77 - met 40% in vergelyking met die huidige generasie van Mali-G76. Dit is bereik deur beide die tegniese proses en argitektoniese verbeterings. Die Mali-G77 kan van 7 tot 16 kerne hΓͺ (skaal van 1 tot 32 is moontlik in die toekoms), en elkeen van hulle is amper dieselfde grootte as die G76. Gevolglik sal hoΓ«-end slimfone waarskynlik dieselfde aantal GPU-kerne hΓͺ.
In speletjies kan jy prestasieverbeterings van tussen 20 en 40% verwag, afhangend van die tipe grafiese werklading. Te oordeel aan die resultate van die gewilde Manhattan GFXBench-toets, sal die aansienlike meerderwaardigheid van die nuwe GPU oor die huidige generasie mededinger Qualcomm dwing om bekommerd te wees oor 'n aansienlike verbetering in Adreno-grafiese werkverrigting.
Op sy eie lewer die nuwe Mali-G77-argitektuur 'n gemiddelde verbetering van 30 persent in kragdoeltreffendheid of werkverrigting, sΓͺ ARM. Die tweede generasie ARM Valhall-skalΓͺre argitektuur laat die GPU toe om 16 instruksies per siklus parallel op die CU uit te voer, in vergelyking met agt in die Bifrost (Mali-G76). Ander innovasies sluit in ten volle hardeware-gedrewe dinamiese instruksieskedulering en 'n heeltemal nuwe instruksiestel terwyl terugwaartse versoenbaarheid met Bifrost gehandhaaf word. Ondersteuning vir die ARM AFBC1.3-kompressieformaat en ander innovasies (FP16-weergawe-teikens, gelaagde weergawe en vertex shader-uitsette) is ook bygevoeg.
Die Bifrost CU het 3 uitvoering-enjins bevat, wat elk 'n instruksiekas, 'n register en 'n Warp-beheereenheid ingesluit het. Verspreiding oor hierdie drie enjins het toegelaat dat 24 FMA-instruksies uitgevoer word teen 32-bis drywende punt-presisie (FP32). In Valhall het elke CU net een uitvoering-enjin, verdeel tussen twee berekeningseenhede wat in staat is om 16 Warp-instruksies per klok te verwerk, wat lei tot 'n totale deurset van 32 FMA FP32-instruksies per CU. Danksy hierdie argitektoniese veranderinge kan Mali-G77 een-derde meer wiskundige berekeninge in parallelle berekeninge uitvoer in vergelyking met Mali-G76.
Daarbenewens bevat elkeen van hierdie CU's twee nuwe wiskundige funksieblokke. Die nuwe omskakelingsenjin (CVT) hanteer basiese heelgetal-, logiese-, tak- en omskakelingsinstruksies. Die spesiale funksie-eenheid (SFU) versnel heelgetalvermenigvuldiging, deling, vierkantswortel, logaritmes en ander komplekse heelgetalfunksies.
Die standaard FMA-blok het verskeie instellings wat 16 FP32-instruksies per siklus ondersteun, 32 vir FP16, of 64 vir INT8 Dot Product. Hierdie optimaliserings kan tot 60% prestasieverbeterings in masjienleertoepassings verskaf.
Nog 'n belangrike verandering in die Mali-G77 is die verdubbeling van die tekstuurenjin se werkverrigting, wat nou 4 bilineΓͺre texels per klok verwerk in vergelyking met die vorige twee, 2 trilineΓͺre texels per klok, wat vinniger FP16- en FP32-filtrering moontlik maak.
ARM het 'n aantal ander veranderinge aangebring, met die Mali-G77 en Valhall wat aansienlike prestasieverbeterings vir speletjie- en masjienleerwerkladings belowe. Wat belangrik is, is dat kragverbruik en skyfie-area op Bifrost-vlakke gehou word, wat mobiele toestelle met hoΓ«r piekwerkverrigting belowe sonder om kragverbruik, hitte-afvoer en groottevereistes te verhoog.
Bron: 3dnews.ru