ARM Mali-G77 GPU on 40 % nopeampi

Yhdessä uuden prosessoriytimen kanssa Cortex-A77 ARM esitteli näytönohjainprosessorin, joka on suunniteltu seuraavan sukupolven yksisiruisiin mobiilijärjestelmiin. Mali-G77, jota ei pidä sekoittaa uuteen näyttöprosessoriin Mali-D77, merkitsee siirtymistä ARM Bifrost -arkkitehtuurista Valhalliin.

ARM Mali-G77 GPU on 40 % nopeampi

ARM ilmoittaa Mali-G77:n grafiikkasuorituskyvyn huomattavan parantuneen - 40% verrattuna nykyiseen Mali-G76:n sukupolveen. Tämä saavutettiin sekä teknisellä prosessilla että arkkitehtonisilla parannuksilla. Mali-G77:ssä voi olla 7-16 ydintä (skaalaus 1:stä 32:een on mahdollista tulevaisuudessa), ja jokainen niistä on lähes samankokoinen kuin G76. Näin ollen huippuluokan älypuhelimissa on todennäköisesti sama määrä GPU-ytimiä.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Pelissä voit odottaa suorituskyvyn parantumista 20–40 % grafiikan työmäärän tyypistä riippuen. Suositun Manhattan GFXBench -testin tulosten perusteella uuden GPU:n merkittävä ylivoima nykyiseen sukupolveen pakottaa kilpailevan Qualcommin huolehtimaan Adreno-grafiikan suorituskyvyn merkittävästä parantumisesta.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Yksinään uusi Mali-G77-arkkitehtuuri parantaa tehokkuutta tai suorituskykyä keskimäärin 30 prosenttia, ARM sanoo. ARM Valhallin toisen sukupolven skalaariarkkitehtuurin avulla GPU voi suorittaa 16 käskyä sykliä kohden rinnakkain CU:ssa, kun taas Bifrostissa (Mali-G76) on kahdeksan käskyä. Muita innovaatioita ovat täysin laitteistopohjainen dynaaminen käskyjen ajoitus ja täysin uusi käskysarja säilyttäen samalla taaksepäin yhteensopivuuden Bifrostin kanssa. Tuki ARM AFBC1.3 -pakkausformaatille ja muille innovaatioille (FP16 renderöintikohteet, kerrosrenderöinti ja vertex-varjostimen lähdöt) on myös lisätty.


ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Bifrost CU sisälsi 3 suoritusmoottoria, joista jokainen sisälsi käskyvälimuistin, rekisterin ja Warp-ohjausyksikön. Jakauma näiden kolmen moottorin kesken mahdollisti 24 FMA-käskyn suorittamisen 32-bittisellä liukulukutarkkuudella (FP32). Valhallissa jokaisessa CU:ssa on vain yksi suoritusmoottori, joka on jaettu kahdelle laskentayksikölle, jotka pystyvät käsittelemään 16 Warp-käskyä kelloa kohden, jolloin kokonaiskapasiteetti on 32 FMA FP32 -käskyä CU:ta kohti. Näiden arkkitehtonisten muutosten ansiosta Mali-G77 voi suorittaa kolmanneksen enemmän matemaattisia laskelmia rinnakkaisissa laskelmissa kuin Mali-G76.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Lisäksi jokainen näistä CU:ista sisältää kaksi uutta matemaattista toimintolohkoa. Uusi muunnosmoottori (CVT) käsittelee peruskokonaisluku-, loogisia-, haara- ja muunnoskäskyjä. Special Function Unit (SFU) nopeuttaa kokonaislukujen kerto-, jakolasku-, neliöjuuri-, logaritmeja ja muita monimutkaisia ​​kokonaislukufunktioita.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Vakio-FMA-lohkossa on useita asetuksia, jotka tukevat 16:ta FP32-käskyä sykliä kohden, 32:ta FP16:lle tai 64:ää INT8 Dot -tuotteelle. Nämä optimoinnit voivat parantaa koneoppimissovellusten suorituskykyä jopa 60 %.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

Toinen tärkeä muutos Mali-G77:ssä on pintakuviomoottorin suorituskyvyn kaksinkertaistuminen. Se käsittelee nyt 4 bilineaarista tekseliä kelloa kohden verrattuna kahteen edelliseen, 2 trilineaarista tekseliä kelloa kohden, mikä mahdollistaa nopeamman FP16- ja FP32-suodatuksen.

ARM Mali-G77 GPU on 40 % nopeampi

ARM Mali-G77 GPU on 40 % nopeampi

ARM on tehnyt useita muita muutoksia, ja Mali-G77 ja Valhall lupaavat merkittäviä suorituskyvyn parannuksia pelaamiseen ja koneoppimiseen. Tärkeää on, että virrankulutus ja sirun pinta-ala pidetään Bifrost-tasolla, mikä lupaa mobiililaitteille korkeamman huippusuorituskyvyn ilman, että virrankulutus, lämmönhajoaminen ja kokovaatimukset kasvavat.



Lähde: 3dnews.ru

Lisää kommentti