Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Нараўне з новым працэсарным ядром Cortex-A77 кампанія ARM прадставіла графічны працэсар, прызначаны для мабільных аднакрыштальных сістэм наступнага пакалення. Mali-G77, які не варта блытаць з новым працэсарам дысплея Mali-D77, азначае сабой пераход з архітэктуры ARM Bifrost і на Valhall.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

ARM дэкларуе істотны прырост графічнай прадукцыйнасці Mali-G77 – на 40% у параўнанні з сучасным пакаленнем Mali-G76. Гэта дасягнута як за кошт тэхпрацэсу, так і архітэктурных паляпшэнняў. Mali-G77 можа мець ад 7 да 16 ядраў (у перспектыве магчыма маштабаванне ад 1 да 32), прычым кожнае з іх амаль такога ж памеру, як у G76. Такім чынам, высокапрадукцыйныя смартфоны, верагодна, будуць абсталёўвацца той жа колькасцю ядраў ГП.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

У гульнях можна чакаць павышэння хуткадзейнасці на ўзроўні ад 20 да 40%, у залежнасці ад тыпу графічных нагрузак. Мяркуючы па выніках папулярнага тэсту Manhattan GFXBench, істотная перавага новага графічнага працэсара над бягучым пакаленнем прымусіць заклапаціцца і канкуруючую кампанію Qualcomm аб значным паляпшэнні прадукцыйнасці графікі Adreno.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Па словах ARM, сама па сабе новая архітэктура Mali-G77 забяспечвае ў сярэднім 30-адсоткавае паляпшэнне энергаэфектыўнасці ці прадукцыйнасці. Другое пакаленне скалярнай архітэктуры ARM Valhall дазваляе графічнаму працэсару раўналежна выконваць 16 каманд за цыкл на CU у параўнанні з васьмю ў Bifrost (Mali-G76). Сярод іншых навін: цалкам апаратна кіраванае дынамічнае планаванне каманд і зусім новы набор каманд з захаваннем зваротнай сумяшчальнасці з Bifrost. Дададзена таксама падтрымка фармату сціску ARM AFBC1.3 і іншыя навінкі (FP16 render targets, layered rendering і vertex shader outputs).


Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

У Bifrost CU утрымоўвалі 3 рухавічка выканання каманд, кожны з якіх уключаў кэш інструкцый, рэгістр і блок кіравання Warp. Размеркаванне па гэтых трох рухавіках дазваляла выконваць 24 інструкцыі FMA з 32-бітнай дакладнасцю разлікаў з якая плавае коскі (FP32). У Valhall кожны CU валодае толькі адным рухавіком выканання каманд, падзеленым паміж двума вылічальнымі модулямі, здольнымі апрацоўваць па 16 каманд Warp за такт, гэта значыць забяспечваецца агульная прапускная здольнасць у 32 інструкцыі FMA FP32 на CU. Дзякуючы гэтым архітэктурным зменам, пры паралельных разліках Mali-G77 можа выконваць на траціну больш матэматычных разлікаў у параўнанні з Mali-G76.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Акрамя таго, кожны з гэтых вылічальных модуляў CU змяшчае два новых матэматычных функцыянальных блока. Новы модуль пераўтварэнні (CVT) апрацоўвае асноўныя цэлалікавыя, лагічныя, галінаваныя і інструкцыі пераўтварэнні. Блок спецыяльных функцый (SFU) паскарае аперацыі множання цэлых лікаў, дзялення, квадратнага кораня, лагарыфмаў і іншых складаных цэлалікавых функцый.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

У стандартным блоку FMA ёсць некалькі налад, якія падтрымліваюць выкананне 16 інструкцый FP32 за цыкл, 32 – FP16 або 64 – INT8 Dot Product. Гэтыя аптымізацыі могуць забяспечыць павышэнне прадукцыйнасці ў дадатках машыннага навучання на значэнне да 60%.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Іншая ключавая змена ў Mali-G77 – гэта падваенне прадукцыйнасці тэкстурнага модуля, які зараз апрацоўвае 4 білінейных тэкселя за такт у параўнанні з двума раней, 2 трылінейных тэкселя за такт, забяспечваючы хутчэйшае фільтраванне FP16 і FP32.

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

Графічны працэсар ARM Mali-G77 стаў на 40% хутчэй

ARM унесла і шэраг іншых змен, у выніку чаго Mali-G77 і Valhall абяцаюць значнае павышэнне прадукцыйнасці для гульнявых нагрузак і задач машыннага навучання. Важна адзначыць, што энергаспажыванне і плошча чыпа захаваны на ўзроўні Bifrost, што абяцае выпуск мабільных прылад з больш высокай пікавай прадукцыйнасцю без павышэння патрабаванняў да электраспажывання, цеплаадводу і памеру.



Крыніца: 3dnews.ru

Дадаць каментар