Kartu su nauju procesoriaus branduoliu
ARM deklaruoja reikšmingą Mali-G77 grafikos našumo padidėjimą - 40%, palyginti su dabartine Mali-G76 karta. Tai buvo pasiekta tiek techniniu procesu, tiek architektūriniais patobulinimais. „Mali-G77“ gali turėti nuo 7 iki 16 branduolių (ateityje galimas mastelis nuo 1 iki 32), ir kiekvienas jų yra beveik tokio pat dydžio kaip G76. Todėl aukščiausios klasės išmanieji telefonai greičiausiai turės tiek pat GPU branduolių.
Žaidimuose galite tikėtis, kad našumas pagerės nuo 20 iki 40%, priklausomai nuo grafikos darbo krūvio tipo. Sprendžiant iš populiaraus Manhattan GFXBench testo rezultatų, didelis naujojo GPU pranašumas prieš dabartinę kartą privers konkurentą Qualcomm nerimauti dėl reikšmingo Adreno grafikos našumo pagerėjimo.
ARM teigia, kad pati nauja „Mali-G77“ architektūra vidutiniškai 30 procentų pagerina energijos vartojimo efektyvumą arba našumą. Antrosios kartos ARM Valhall skaliarinė architektūra leidžia GPU lygiagrečiai vykdyti 16 instrukcijų per ciklą CU, palyginti su aštuoniomis Bifrost (Mali-G76). Kitos naujovės apima visiškai aparatūros valdomą dinaminį instrukcijų planavimą ir visiškai naują instrukcijų rinkinį, išlaikant atgalinį suderinamumą su Bifrost. Taip pat buvo pridėtas ARM AFBC1.3 glaudinimo formato ir kitų naujovių palaikymas (FP16 atvaizdavimo tikslai, sluoksnių atvaizdavimas ir viršūnių šešėlių išvestis).
Bifrost CU buvo 3 vykdymo varikliai, kurių kiekvienas turėjo instrukcijų talpyklą, registrą ir Warp valdymo bloką. Paskirstymas tarp šių trijų variklių leido vykdyti 24 FMA komandas 32 bitų slankiojo kablelio tikslumu (FP32). Valhall kiekviename CU yra tik vienas vykdymo variklis, padalintas į du skaičiavimo blokus, galinčius apdoroti 16 Warp instrukcijų per laikrodį, todėl bendras 32 FMA FP32 nurodymų pralaidumas vienam CU. Dėl šių architektūrinių pakeitimų Mali-G77 lygiagrečiai gali atlikti trečdaliu daugiau matematinių skaičiavimų, palyginti su Mali-G76.
Be to, kiekviename iš šių CU yra du nauji matematiniai funkcijų blokai. Naujasis konvertavimo variklis (CVT) tvarko pagrindines sveikųjų skaičių, loginių, šakų ir konvertavimo instrukcijas. Specialiųjų funkcijų vienetas (SFU) pagreitina sveikųjų skaičių dauginimą, padalijimą, kvadratinę šaknį, logaritmus ir kitas sudėtingas sveikųjų skaičių funkcijas.
Standartiniame FMA bloke yra keletas nustatymų, kurie palaiko 16 FP32 instrukcijų per ciklą, 32 – FP16 arba 64 – INT8 taškinio produkto. Šie optimizavimai gali iki 60 % pagerinti mašininio mokymosi programų našumą.
Kitas svarbus „Mali-G77“ pokytis yra padvigubintas tekstūros variklio našumas, kuris dabar apdoroja 4 bilinijinius tekselius vienam laikrodžiui, palyginti su ankstesniais dviem, 2 trilinijinius tekselius vienam laikrodžiui, todėl galima greičiau filtruoti FP16 ir FP32.
ARM padarė daugybę kitų pakeitimų, o „Mali-G77“ ir „Valhall“ žada reikšmingus žaidimų ir mašininio mokymosi darbo krūvių našumo patobulinimus. Svarbu tai, kad energijos suvartojimas ir lusto plotas išlaikomas Bifrost lygiu, todėl mobilieji įrenginiai turi didesnį maksimalų našumą, nepadidinant energijos suvartojimo, šilumos išsklaidymo ir dydžio reikalavimų.
Šaltinis: 3dnews.ru