ARM Mali-G77 GPU on 40% kiirem

Koos uue protsessori tuumaga Cortex-A77 ARM tutvustas graafikaprotsessorit, mis on mõeldud järgmise põlvkonna mobiilsete ühekiibiliste süsteemide jaoks. Mali-G77, mida ei tohiks segi ajada uue ekraaniprotsessoriga Mali-D77, tähistab üleminekut ARM Bifrosti arhitektuurilt Valhallile.

ARM Mali-G77 GPU on 40% kiirem

ARM deklareerib Mali-G77 graafika jõudluse olulist tõusu - 40% võrreldes praeguse põlvkonna Mali-G76-ga. See saavutati nii tehnilise protsessi kui ka arhitektuursete täiustuste kaudu. Mali-G77-l võib olla 7 kuni 16 südamikku (tulevikus on võimalik skaleerida 1-lt 32-ni) ja igaüks neist on peaaegu sama suur kui G76. Järelikult on tipptasemel nutitelefonidel tõenäoliselt sama arv GPU südamikke.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

Mängude puhul võib olenevalt graafika töökoormuse tüübist oodata jõudluse paranemist 20–40%. Otsustades populaarse Manhattani GFXBenchi testi tulemuste põhjal, sunnib uue GPU märkimisväärne paremus praeguse põlvkonna ees rivaali Qualcommi muretsema Adreno graafika jõudluse olulise paranemise pärast.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

ARM ütleb, et uus Mali-G77 arhitektuur parandab üksinda energiatõhusust või jõudlust keskmiselt 30 protsenti. Teise põlvkonna ARM Valhalli skalaararhitektuur võimaldab GPU-l täita CU-s paralleelselt 16 käsku tsükli kohta, võrreldes Bifrosti (Mali-G76) kaheksa käsuga. Muud uuendused hõlmavad täielikult riistvarapõhist dünaamilist juhiste ajastamist ja täiesti uut juhiste komplekti, säilitades samal ajal tagasiühilduvuse Bifrostiga. Lisatud on ka ARM AFBC1.3 tihendusvormingu tugi ja muud uuendused (FP16 renderdamise sihtmärgid, kihiline renderdus ja tipuvarjurite väljundid).


ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

Bifrost CU sisaldas 3 täitmismootorit, millest igaüks sisaldas käskude vahemälu, registrit ja Warpi juhtseadet. Jaotus nende kolme mootori vahel võimaldas täita 24 FMA-käsku 32-bitise ujukoma täpsusega (FP32). Valhallis on igal CU-l ainult üks täitmismootor, mis on jagatud kahe arvutusüksuse vahel, mis on võimelised töötlema 16 Warp-käsku kella kohta, mille tulemuseks on 32 FMA FP32 käsku läbilaskevõime CU kohta. Tänu nendele arhitektuurilistele muudatustele suudab Mali-G77 paralleelarvutustes teha kolmandiku võrra rohkem matemaatilisi arvutusi võrreldes Mali-G76-ga.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

Lisaks sisaldab igaüks neist CU-dest kahte uut matemaatilist funktsiooniplokki. Uus konversioonimootor (CVT) käsitleb põhilisi täisarvude, loogiliste, harude ja teisendusjuhiseid. Spetsiaalfunktsiooni ühik (SFU) kiirendab täisarvude korrutamist, jagamist, ruutjuurt, logaritme ja muid keerulisi täisarvu funktsioone.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

Standardsel FMA-plokil on mitu seadet, mis toetavad 16 FP32 käsku tsükli kohta, 32 FP16 jaoks või 64 INT8 Dot Producti jaoks. Need optimeerimised võivad masinõpperakendustes jõudlust parandada kuni 60%.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

Teine oluline muudatus Mali-G77 puhul on tekstuurimootori jõudluse kahekordistumine, mis nüüd töötleb 4 bilineaarset tekseli kella kohta võrreldes eelmise kahega, 2 trilineaarset tekslit kella kohta, võimaldades kiiremat FP16 ja FP32 filtreerimist.

ARM Mali-G77 GPU on 40% kiirem

ARM Mali-G77 GPU on 40% kiirem

ARM on teinud mitmeid muid muudatusi, Mali-G77 ja Valhall lubavad mängude ja masinõppe töökoormuse jaoks olulisi jõudluse parandusi. Oluline on see, et energiatarve ja kiibi pindala hoitakse Bifrosti tasemel, mis lubab mobiilseadmetel suuremat tippjõudlust ilma energiatarbimist, soojuse hajumist ja suuruse nõudeid suurendamata.



Allikas: 3dnews.ru

Lisa kommentaar