Împreună cu noul nucleu de procesor
ARM declară o creștere semnificativă a performanței grafice a lui Mali-G77 - cu 40% față de generația actuală a lui Mali-G76. Acest lucru a fost realizat atât prin procesul tehnic, cât și prin îmbunătățiri arhitecturale. Mali-G77 poate avea de la 7 la 16 nuclee (scalarea de la 1 la 32 este posibilă în viitor), iar fiecare dintre ele are aproape aceeași dimensiune ca și G76. În consecință, smartphone-urile de ultimă generație vor avea probabil același număr de nuclee GPU.
În jocuri, vă puteți aștepta la îmbunătățiri de performanță între 20 și 40%, în funcție de tipul de sarcină de lucru grafică. Judecând după rezultatele popularului test Manhattan GFXBench, superioritatea semnificativă a noului GPU față de generația actuală va forța rivalul Qualcomm să-și facă griji cu privire la o îmbunătățire semnificativă a performanței grafice Adreno.
Pe cont propriu, noua arhitectură Mali-G77 oferă o îmbunătățire medie cu 30% a eficienței energetice sau a performanței, spune ARM. A doua generație de arhitectură scalară ARM Valhall permite GPU-ului să execute 16 instrucțiuni pe ciclu în paralel pe CU, în comparație cu opt în Bifrost (Mali-G76). Alte inovații includ programarea dinamică a instrucțiunilor complet bazată pe hardware și un set de instrucțiuni complet nou, menținând în același timp compatibilitatea cu Bifrost. S-a adăugat, de asemenea, suport pentru formatul de compresie ARM AFBC1.3 și alte inovații (ținte de randare FP16, randare stratificată și ieșiri de umbrire vertex).
Bifrost CU conținea 3 motoare de execuție, fiecare dintre acestea incluzând un cache de instrucțiuni, un registru și o unitate de control Warp. Distribuția pe aceste trei motoare a permis executarea a 24 de instrucțiuni FMA la o precizie în virgulă mobilă de 32 de biți (FP32). În Valhall, fiecare CU are un singur motor de execuție, împărțit între două unități de calcul capabile să proceseze 16 instrucțiuni Warp per clock, rezultând un debit total de 32 de instrucțiuni FMA FP32 per CU. Datorită acestor modificări arhitecturale, Mali-G77 poate efectua cu o treime mai multe calcule matematice în calcule paralele, comparativ cu Mali-G76.
În plus, fiecare dintre aceste CU conține două noi blocuri funcționale matematice. Noul motor de conversie (CVT) gestionează instrucțiunile de bază cu numere întregi, logice, ramuri și conversie. Unitatea de funcții speciale (SFU) accelerează înmulțirea întregului, diviziunea, rădăcina pătrată, logaritmii și alte funcții întregi complexe.
Blocul FMA standard are mai multe setări care acceptă 16 instrucțiuni FP32 per ciclu, 32 pentru FP16 sau 64 pentru INT8 Dot Product. Aceste optimizări pot oferi îmbunătățiri de performanță cu până la 60% în aplicațiile de învățare automată.
O altă schimbare cheie la Mali-G77 este dublarea performanței motorului de textură, care procesează acum 4 texeli biliniari pe ceas în comparație cu cei doi anteriori, 2 texeli triliniari pe ceas, permițând o filtrare mai rapidă FP16 și FP32.
ARM a făcut o serie de alte modificări, Mali-G77 și Valhall promițând îmbunătățiri semnificative ale performanței pentru sarcinile de lucru pentru jocuri și învățare automată. Foarte important, consumul de energie și suprafața cipului sunt menținute la niveluri Bifrost, promițând dispozitive mobile cu performanțe de vârf mai mari, fără a crește consumul de energie, disiparea căldurii și cerințele de dimensiune.
Sursa: 3dnews.ru