GPU-ul ARM Mali-G77 este cu 40% mai rapid

Împreună cu noul nucleu de procesor Cortex-A77 ARM a introdus un procesor grafic conceput pentru sistemele mobile cu un singur cip de generație următoare. Mali-G77, care nu trebuie confundat cu noul procesor de afișare Mali-D77, marchează tranziția de la arhitectura ARM Bifrost la Valhall.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

ARM declară o creștere semnificativă a performanței grafice a lui Mali-G77 - cu 40% față de generația actuală a lui Mali-G76. Acest lucru a fost realizat atât prin procesul tehnic, cât și prin îmbunătățiri arhitecturale. Mali-G77 poate avea de la 7 la 16 nuclee (scalarea de la 1 la 32 este posibilă în viitor), iar fiecare dintre ele are aproape aceeași dimensiune ca și G76. În consecință, smartphone-urile de ultimă generație vor avea probabil același număr de nuclee GPU.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

În jocuri, vă puteți aștepta la îmbunătățiri de performanță între 20 și 40%, în funcție de tipul de sarcină de lucru grafică. Judecând după rezultatele popularului test Manhattan GFXBench, superioritatea semnificativă a noului GPU față de generația actuală va forța rivalul Qualcomm să-și facă griji cu privire la o îmbunătățire semnificativă a performanței grafice Adreno.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

Pe cont propriu, noua arhitectură Mali-G77 oferă o îmbunătățire medie cu 30% a eficienței energetice sau a performanței, spune ARM. A doua generație de arhitectură scalară ARM Valhall permite GPU-ului să execute 16 instrucțiuni pe ciclu în paralel pe CU, în comparație cu opt în Bifrost (Mali-G76). Alte inovații includ programarea dinamică a instrucțiunilor complet bazată pe hardware și un set de instrucțiuni complet nou, menținând în același timp compatibilitatea cu Bifrost. S-a adăugat, de asemenea, suport pentru formatul de compresie ARM AFBC1.3 și alte inovații (ținte de randare FP16, randare stratificată și ieșiri de umbrire vertex).


GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

Bifrost CU conținea 3 motoare de execuție, fiecare dintre acestea incluzând un cache de instrucțiuni, un registru și o unitate de control Warp. Distribuția pe aceste trei motoare a permis executarea a 24 de instrucțiuni FMA la o precizie în virgulă mobilă de 32 de biți (FP32). În Valhall, fiecare CU are un singur motor de execuție, împărțit între două unități de calcul capabile să proceseze 16 instrucțiuni Warp per clock, rezultând un debit total de 32 de instrucțiuni FMA FP32 per CU. Datorită acestor modificări arhitecturale, Mali-G77 poate efectua cu o treime mai multe calcule matematice în calcule paralele, comparativ cu Mali-G76.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

În plus, fiecare dintre aceste CU conține două noi blocuri funcționale matematice. Noul motor de conversie (CVT) gestionează instrucțiunile de bază cu numere întregi, logice, ramuri și conversie. Unitatea de funcții speciale (SFU) accelerează înmulțirea întregului, diviziunea, rădăcina pătrată, logaritmii și alte funcții întregi complexe.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

Blocul FMA standard are mai multe setări care acceptă 16 instrucțiuni FP32 per ciclu, 32 pentru FP16 sau 64 pentru INT8 Dot Product. Aceste optimizări pot oferi îmbunătățiri de performanță cu până la 60% în aplicațiile de învățare automată.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

O altă schimbare cheie la Mali-G77 este dublarea performanței motorului de textură, care procesează acum 4 texeli biliniari pe ceas în comparație cu cei doi anteriori, 2 texeli triliniari pe ceas, permițând o filtrare mai rapidă FP16 și FP32.

GPU-ul ARM Mali-G77 este cu 40% mai rapid

GPU-ul ARM Mali-G77 este cu 40% mai rapid

ARM a făcut o serie de alte modificări, Mali-G77 și Valhall promițând îmbunătățiri semnificative ale performanței pentru sarcinile de lucru pentru jocuri și învățare automată. Foarte important, consumul de energie și suprafața cipului sunt menținute la niveluri Bifrost, promițând dispozitive mobile cu performanțe de vârf mai mari, fără a crește consumul de energie, disiparea căldurii și cerințele de dimensiune.



Sursa: 3dnews.ru

Adauga un comentariu