ARM Mali-G77 GPU yra 40% greitesnis

Kartu su nauju procesoriaus branduoliu Cortex-A77 ARM pristatė grafikos procesorių, skirtą naujos kartos mobiliosioms vieno lusto sistemoms. Mali-G77, kurio nereikėtų painioti su nauju ekrano procesoriumi Malis-D77, žymi perėjimą nuo ARM Bifrost architektūros prie Valhall.

ARM Mali-G77 GPU yra 40% greitesnis

ARM deklaruoja reikšmingą Mali-G77 grafikos našumo padidėjimą - 40%, palyginti su dabartine Mali-G76 karta. Tai buvo pasiekta tiek techniniu procesu, tiek architektūriniais patobulinimais. „Mali-G77“ gali turėti nuo 7 iki 16 branduolių (ateityje galimas mastelis nuo 1 iki 32), ir kiekvienas jų yra beveik tokio pat dydžio kaip G76. Todėl aukščiausios klasės išmanieji telefonai greičiausiai turės tiek pat GPU branduolių.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

Žaidimuose galite tikėtis, kad našumas pagerės nuo 20 iki 40%, priklausomai nuo grafikos darbo krūvio tipo. Sprendžiant iš populiaraus Manhattan GFXBench testo rezultatų, didelis naujojo GPU pranašumas prieš dabartinę kartą privers konkurentą Qualcomm nerimauti dėl reikšmingo Adreno grafikos našumo pagerėjimo.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

ARM teigia, kad pati nauja „Mali-G77“ architektūra vidutiniškai 30 procentų pagerina energijos vartojimo efektyvumą arba našumą. Antrosios kartos ARM Valhall skaliarinė architektūra leidžia GPU lygiagrečiai vykdyti 16 instrukcijų per ciklą CU, palyginti su aštuoniomis Bifrost (Mali-G76). Kitos naujovės apima visiškai aparatūros valdomą dinaminį instrukcijų planavimą ir visiškai naują instrukcijų rinkinį, išlaikant atgalinį suderinamumą su Bifrost. Taip pat buvo pridėtas ARM AFBC1.3 glaudinimo formato ir kitų naujovių palaikymas (FP16 atvaizdavimo tikslai, sluoksnių atvaizdavimas ir viršūnių šešėlių išvestis).


ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

Bifrost CU buvo 3 vykdymo varikliai, kurių kiekvienas turėjo instrukcijų talpyklą, registrą ir Warp valdymo bloką. Paskirstymas tarp šių trijų variklių leido vykdyti 24 FMA komandas 32 bitų slankiojo kablelio tikslumu (FP32). Valhall kiekviename CU yra tik vienas vykdymo variklis, padalintas į du skaičiavimo blokus, galinčius apdoroti 16 Warp instrukcijų per laikrodį, todėl bendras 32 FMA FP32 nurodymų pralaidumas vienam CU. Dėl šių architektūrinių pakeitimų Mali-G77 lygiagrečiai gali atlikti trečdaliu daugiau matematinių skaičiavimų, palyginti su Mali-G76.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

Be to, kiekviename iš šių CU yra du nauji matematiniai funkcijų blokai. Naujasis konvertavimo variklis (CVT) tvarko pagrindines sveikųjų skaičių, loginių, šakų ir konvertavimo instrukcijas. Specialiųjų funkcijų vienetas (SFU) pagreitina sveikųjų skaičių dauginimą, padalijimą, kvadratinę šaknį, logaritmus ir kitas sudėtingas sveikųjų skaičių funkcijas.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

Standartiniame FMA bloke yra keletas nustatymų, kurie palaiko 16 FP32 instrukcijų per ciklą, 32 – FP16 arba 64 – INT8 taškinio produkto. Šie optimizavimai gali iki 60 % pagerinti mašininio mokymosi programų našumą.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

Kitas svarbus „Mali-G77“ pokytis yra padvigubintas tekstūros variklio našumas, kuris dabar apdoroja 4 bilinijinius tekselius vienam laikrodžiui, palyginti su ankstesniais dviem, 2 trilinijinius tekselius vienam laikrodžiui, todėl galima greičiau filtruoti FP16 ir FP32.

ARM Mali-G77 GPU yra 40% greitesnis

ARM Mali-G77 GPU yra 40% greitesnis

ARM padarė daugybę kitų pakeitimų, o „Mali-G77“ ir „Valhall“ žada reikšmingus žaidimų ir mašininio mokymosi darbo krūvių našumo patobulinimus. Svarbu tai, kad energijos suvartojimas ir lusto plotas išlaikomas Bifrost lygiu, todėl mobilieji įrenginiai turi didesnį maksimalų našumą, nepadidinant energijos suvartojimo, šilumos išsklaidymo ir dydžio reikalavimų.



Šaltinis: 3dnews.ru

Добавить комментарий