Yhdessä uuden prosessoriytimen kanssa
ARM ilmoittaa Mali-G77:n grafiikkasuorituskyvyn huomattavan parantuneen - 40% verrattuna nykyiseen Mali-G76:n sukupolveen. Tämä saavutettiin sekä teknisellä prosessilla että arkkitehtonisilla parannuksilla. Mali-G77:ssä voi olla 7-16 ydintä (skaalaus 1:stä 32:een on mahdollista tulevaisuudessa), ja jokainen niistä on lähes samankokoinen kuin G76. Näin ollen huippuluokan älypuhelimissa on todennäköisesti sama määrä GPU-ytimiä.
Pelissä voit odottaa suorituskyvyn parantumista 20–40 % grafiikan työmäärän tyypistä riippuen. Suositun Manhattan GFXBench -testin tulosten perusteella uuden GPU:n merkittävä ylivoima nykyiseen sukupolveen pakottaa kilpailevan Qualcommin huolehtimaan Adreno-grafiikan suorituskyvyn merkittävästä parantumisesta.
Yksinään uusi Mali-G77-arkkitehtuuri parantaa tehokkuutta tai suorituskykyä keskimäärin 30 prosenttia, ARM sanoo. ARM Valhallin toisen sukupolven skalaariarkkitehtuurin avulla GPU voi suorittaa 16 käskyä sykliä kohden rinnakkain CU:ssa, kun taas Bifrostissa (Mali-G76) on kahdeksan käskyä. Muita innovaatioita ovat täysin laitteistopohjainen dynaaminen käskyjen ajoitus ja täysin uusi käskysarja säilyttäen samalla taaksepäin yhteensopivuuden Bifrostin kanssa. Tuki ARM AFBC1.3 -pakkausformaatille ja muille innovaatioille (FP16 renderöintikohteet, kerrosrenderöinti ja vertex-varjostimen lähdöt) on myös lisätty.
Bifrost CU sisälsi 3 suoritusmoottoria, joista jokainen sisälsi käskyvälimuistin, rekisterin ja Warp-ohjausyksikön. Jakauma näiden kolmen moottorin kesken mahdollisti 24 FMA-käskyn suorittamisen 32-bittisellä liukulukutarkkuudella (FP32). Valhallissa jokaisessa CU:ssa on vain yksi suoritusmoottori, joka on jaettu kahdelle laskentayksikölle, jotka pystyvät käsittelemään 16 Warp-käskyä kelloa kohden, jolloin kokonaiskapasiteetti on 32 FMA FP32 -käskyä CU:ta kohti. Näiden arkkitehtonisten muutosten ansiosta Mali-G77 voi suorittaa kolmanneksen enemmän matemaattisia laskelmia rinnakkaisissa laskelmissa kuin Mali-G76.
Lisäksi jokainen näistä CU:ista sisältää kaksi uutta matemaattista toimintolohkoa. Uusi muunnosmoottori (CVT) käsittelee peruskokonaisluku-, loogisia-, haara- ja muunnoskäskyjä. Special Function Unit (SFU) nopeuttaa kokonaislukujen kerto-, jakolasku-, neliöjuuri-, logaritmeja ja muita monimutkaisia kokonaislukufunktioita.
Vakio-FMA-lohkossa on useita asetuksia, jotka tukevat 16:ta FP32-käskyä sykliä kohden, 32:ta FP16:lle tai 64:ää INT8 Dot -tuotteelle. Nämä optimoinnit voivat parantaa koneoppimissovellusten suorituskykyä jopa 60 %.
Toinen tärkeä muutos Mali-G77:ssä on pintakuviomoottorin suorituskyvyn kaksinkertaistuminen. Se käsittelee nyt 4 bilineaarista tekseliä kelloa kohden verrattuna kahteen edelliseen, 2 trilineaarista tekseliä kelloa kohden, mikä mahdollistaa nopeamman FP16- ja FP32-suodatuksen.
ARM on tehnyt useita muita muutoksia, ja Mali-G77 ja Valhall lupaavat merkittäviä suorituskyvyn parannuksia pelaamiseen ja koneoppimiseen. Tärkeää on, että virrankulutus ja sirun pinta-ala pidetään Bifrost-tasolla, mikä lupaa mobiililaitteille korkeamman huippusuorituskyvyn ilman, että virrankulutus, lämmönhajoaminen ja kokovaatimukset kasvavat.
Lähde: 3dnews.ru