Prozesadorearen nukleo berriarekin batera
ARM-k Mali-G77-ren errendimendu grafikoaren igoera nabarmena deklaratzen du -% 40koa Mali-G76-ren egungo belaunaldiarekin alderatuta. Hori bai prozesu teknikoaren eta baita arkitekturaren hobekuntzaren bidez lortu zen. Mali-G77-k 7 eta 16 nukleo izan ditzake (etorkizunean 1etik 32ra eskalatzea posible da), eta horietako bakoitza G76ren ia tamaina berekoa da. Ondorioz, goi-mailako telefono adimendunek ziurrenik GPU nukleo kopuru bera izango dute.
Jokuetan, errendimendua % 20 eta 40 arteko hobekuntza espero dezakezu, grafikoen lan-karga motaren arabera. Manhattan GFXBench proba ezagunaren emaitzak ikusita, GPU berriak egungo belaunaldiarekiko duen nagusitasun nabarmenak Qualcomm arerioa Adreno grafikoen errendimenduaren hobekuntza nabarmenaz kezkatzera behartuko du.
Bere kabuz, Mali-G77 arkitektura berriak %30eko batez besteko hobekuntza eskaintzen du potentzia-eraginkortasunean edo errendimenduan, ARM-k dioenez. ARM Valhall arkitektura eskalaren bigarren belaunaldiari esker, GPUk 16 jarraibide exekutatu ditzake ziklo bakoitzeko CUn paraleloan, Bifrost-en zortziren aldean (Mali-G76). Beste berrikuntza batzuen artean, guztiz hardwarean gidatutako instrukzioen programazio dinamikoa eta argibide multzo guztiz berria daude Bifrost-ekin atzerako bateragarritasuna mantenduz. ARM AFBC1.3 konpresio formatuaren euskarria eta beste berrikuntza batzuk ere gehitu dira (FP16 errendatze-helburuak, geruzetako errendaketa eta vertex-shader irteerak).
Bifrost CUk 3 exekuzio-motor zituen, eta horietako bakoitzak instrukzio-cache bat, erregistro bat eta Warp kontrol-unitate bat zituen. Hiru motor hauen arteko banaketari esker, 24 FMA instrukzio 32 biteko koma mugikorreko doitasunarekin (FP32) exekutatu ziren. Valhall-en, CU bakoitzak exekuzio-motor bakarra du, erloju bakoitzeko 16 Warp instrukzio prozesatzeko gai diren bi kalkulu-unitateren artean banatuta, eta ondorioz, CU bakoitzeko 32 FMA FP32 instrukzioko errendimendua lortzen da. Aldaketa arkitektoniko hauei esker, Mali-G77-k kalkulu matematiko gehiago egin ditzake kalkulu paraleloetan Mali-G76rekin alderatuta.
Horrez gain, CU horietako bakoitzak bi funtzio-bloke matematiko berri ditu. Bihurketa-motor berriak (CVT) oinarrizko zenbaki osoak, logikoak, adarrak eta bihurketa-argibideak kudeatzen ditu. Funtzio Berezien Unitateak (SFU) zenbaki osoen biderketa, zatiketa, erro karratua, logaritmoak eta beste hainbat funtzio konplexu bizkortzen ditu.
FMA bloke estandarrak ziklo bakoitzeko 16 FP32 jarraibide onartzen dituzten hainbat ezarpen ditu, 32 FP16rako edo 64 INT8 Dot Producterako. Optimizazio hauek %60ko errendimendu hobekuntzak eman ditzakete ikaskuntza automatikoko aplikazioetan.
Mali-G77-n beste funtsezko aldaketa bat ehundura-motorren errendimendua bikoiztu izana da, orain 4 texel bilineal prozesatzen ditu erloju bakoitzeko aurreko biekin alderatuta, 2 texel trilineal erloju bakoitzeko, FP16 eta FP32 iragazketa azkarragoa ahalbidetuz.
ARM-ek beste aldaketa batzuk egin ditu, Mali-G77 eta Valhall-ek errendimendu hobekuntza esanguratsuak agintzen baitituzte jokoetarako eta ikaskuntza automatikoko lan-kargak egiteko. Garrantzitsua da energia-kontsumoa eta txip-eremua Bifrost-en mailan mantentzen direla, errendimendu altuagoa duten gailu mugikorrak itxaropentsuak dituzten energia-kontsumoa, beroaren xahupena eta tamaina-eskakizunak handitu gabe.
Iturria: 3dnews.ru