GPU ARM Mali-G77 është 40% më i shpejtë

Së bashku me bërthamën e re të procesorit Cortex-A77 ARM prezantoi një procesor grafik të krijuar për sistemet celulare të gjeneratës së ardhshme me një çip. Mali-G77, i cili nuk duhet të ngatërrohet me procesorin e ri të ekranit Mali-D77, shënon kalimin nga arkitektura ARM Bifrost në Valhall.

GPU ARM Mali-G77 është 40% më i shpejtë

ARM deklaron një rritje të konsiderueshme në performancën grafike të Mali-G77 - me 40% krahasuar me gjeneratën aktuale të Mali-G76. Kjo u arrit si përmes procesit teknik ashtu edhe përmirësimeve arkitekturore. Mali-G77 mund të ketë nga 7 deri në 16 bërthama (shkallëzimi nga 1 në 32 është i mundur në të ardhmen), dhe secila prej tyre ka pothuajse të njëjtën madhësi si G76. Rrjedhimisht, telefonat inteligjentë të nivelit të lartë ka të ngjarë të kenë të njëjtin numër bërthamash GPU.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Në lojëra, mund të prisni përmirësime të performancës midis 20 dhe 40%, në varësi të llojit të ngarkesës së punës grafike. Duke gjykuar nga rezultatet e testit popullor Manhattan GFXBench, epërsia e konsiderueshme e GPU-së së re ndaj gjeneratës aktuale do ta detyrojë rivalin Qualcomm të shqetësohet për një përmirësim të ndjeshëm në performancën grafike Adreno.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Më vete, arkitektura e re Mali-G77 jep një përmirësim mesatar prej 30 përqind në efikasitetin ose performancën e energjisë, thotë ARM. Gjenerata e dytë e arkitekturës skalare ARM Valhall lejon GPU-në të ekzekutojë 16 instruksione për cikël paralelisht në CU, krahasuar me tetë në Bifrost (Mali-G76). Risi të tjera përfshijnë planifikimin dinamik të udhëzimeve të drejtuara plotësisht nga hardueri dhe një grup plotësisht të ri instruksionesh duke ruajtur përputhshmërinë e prapambetur me Bifrost. Mbështetja për formatin e ngjeshjes ARM AFBC1.3 dhe risi të tjera (objektivat e renderimit FP16, paraqitjet me shtresa dhe daljet e shaderit vertex) janë shtuar gjithashtu.


GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Bifrost CU përmbante 3 motorë ekzekutimi, secili prej të cilëve përfshinte një memorie instruksionesh, një regjistër dhe një njësi kontrolli Warp. Shpërndarja nëpër këta tre motorë lejoi që 24 udhëzime FMA të ekzekutoheshin me saktësi 32-bit me pikë lundruese (FP32). Në Valhall, çdo CU ka vetëm një motor ekzekutimi, të ndarë midis dy njësive llogaritëse të afta për të përpunuar 16 instruksione Warp për orë, duke rezultuar në një xhiros total prej 32 instruksione FMA FP32 për CU. Falë këtyre ndryshimeve arkitekturore, Mali-G77 mund të kryejë një të tretën më shumë llogaritje matematikore në llogaritje paralele në krahasim me Mali-G76.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Përveç kësaj, secila prej këtyre CU përmban dy blloqe të reja funksionesh matematikore. Motori i ri i konvertimit (CVT) trajton instruksionet bazë të numrave të plotë, logjikë, degëzimit dhe konvertimit. Njësia e Funksionit Special (SFU) përshpejton shumëzimin e numrave të plotë, pjesëtimin, rrënjën katrore, logaritmet dhe funksionet e tjera komplekse të numrave të plotë.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Blloku standard FMA ka disa cilësime që mbështesin 16 udhëzime FP32 për cikël, 32 për FP16 ose 64 për INT8 Dot Product. Këto optimizime mund të ofrojnë deri në 60% përmirësime të performancës në aplikacionet e mësimit të makinerive.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

Një tjetër ndryshim kyç në Mali-G77 është dyfishimi i performancës së motorit me teksturë, i cili tani përpunon 4 teksele bilineare për orë në krahasim me dy të mëparshmet, 2 teksele trilineare për orë, duke mundësuar filtrim më të shpejtë FP16 dhe FP32.

GPU ARM Mali-G77 është 40% më i shpejtë

GPU ARM Mali-G77 është 40% më i shpejtë

ARM ka bërë një sërë ndryshimesh të tjera, me Mali-G77 dhe Valhall që premtojnë përmirësime të rëndësishme të performancës për ngarkesat e punës së lojërave dhe mësimit të makinerive. E rëndësishmja, konsumi i energjisë dhe zona e çipit mbahen në nivele Bifrost, duke premtuar pajisje celulare me performancë më të lartë pa rritje të konsumit të energjisë, shpërndarjes së nxehtësisë dhe kërkesave për madhësi.



Burimi: 3dnews.ru

Shto një koment