Spolu s novým jadrom procesora
ARM deklaruje výrazný nárast grafického výkonu Mali-G77 – o 40 % v porovnaní so súčasnou generáciou Mali-G76. Dosiahlo sa to technickým procesom a architektonickými vylepšeniami. Mali-G77 môže mať od 7 do 16 jadier (v budúcnosti je možné škálovanie od 1 do 32) a každé z nich má takmer rovnakú veľkosť ako G76. V dôsledku toho budú smartfóny vyššej kategórie pravdepodobne obsahovať rovnaký počet jadier GPU.
V hrách môžete očakávať zlepšenie výkonu o 20 až 40 % v závislosti od typu grafického zaťaženia. Súdiac podľa výsledkov populárneho testu Manhattan GFXBench, výrazná prevaha nového GPU oproti súčasnej generácii prinúti konkurenčný Qualcomm k obavám o výrazné zlepšenie grafického výkonu Adreno.
Samotná nová architektúra Mali-G77 prináša priemerné 30-percentné zlepšenie energetickej účinnosti alebo výkonu, hovorí ARM. Druhá generácia skalárnej architektúry ARM Valhall umožňuje GPU vykonávať 16 inštrukcií za cyklus paralelne na CU, v porovnaní s ôsmimi v Bifrost (Mali-G76). Medzi ďalšie inovácie patrí plne hardvérovo riadené dynamické plánovanie inštrukcií a úplne nová inštrukčná sada pri zachovaní spätnej kompatibility s Bifrost. Pridaná bola aj podpora kompresného formátu ARM AFBC1.3 a ďalšie novinky (ciele vykresľovania FP16, vrstvené vykresľovanie a výstupy vertex shader).
Bifrost CU obsahovala 3 vykonávacie motory, z ktorých každý obsahoval inštrukčnú cache, register a riadiacu jednotku Warp. Distribúcia cez tieto tri motory umožnila vykonať 24 inštrukcií FMA s 32-bitovou presnosťou s pohyblivou rádovou čiarkou (FP32). Vo Valhall má každá CU iba jeden vykonávací engine, rozdelený medzi dve výpočtové jednotky schopné spracovať 16 Warp inštrukcií na takt, čo vedie k celkovej priepustnosti 32 FMA FP32 inštrukcií na CU. Vďaka týmto architektonickým zmenám môže Mali-G77 vykonávať o jednu tretinu viac matematických výpočtov v paralelných výpočtoch v porovnaní s Mali-G76.
Okrem toho každá z týchto CU obsahuje dva nové matematické funkčné bloky. Nový prevodný nástroj (CVT) spracováva základné celočíselné, logické, vetvové a prevodné inštrukcie. Jednotka špeciálnej funkcie (SFU) urýchľuje celočíselné násobenie, delenie, druhú odmocninu, logaritmy a ďalšie komplexné celočíselné funkcie.
Štandardný blok FMA má niekoľko nastavení, ktoré podporujú 16 FP32 inštrukcií na cyklus, 32 pre FP16 alebo 64 pre INT8 Dot Product. Tieto optimalizácie môžu poskytnúť až 60% zlepšenie výkonu v aplikáciách strojového učenia.
Ďalšou kľúčovou zmenou v Mali-G77 je zdvojnásobenie výkonu textúrového enginu, ktorý teraz spracováva 4 bilineárne texely na takt v porovnaní s predchádzajúcimi dvoma, 2 trilineárne texely na takt, čo umožňuje rýchlejšie filtrovanie FP16 a FP32.
ARM urobilo množstvo ďalších zmien, pričom Mali-G77 a Valhall sľubovali výrazné vylepšenia výkonu pre herné a strojové učenie. Dôležité je, že spotreba energie a plocha čipu sú udržiavané na úrovniach Bifrost, čo sľubuje mobilné zariadenia s vyšším špičkovým výkonom bez zvýšenia spotreby energie, rozptylu tepla a požiadaviek na veľkosť.
Zdroj: 3dnews.ru