Inseme cù u novu core di processore
ARM dichjara un aumentu significativu in u rendiment graficu di u Mali-G77 - da 40% paragunatu à a generazione attuale di Mali-G76. Questu hè stata ottenuta à traversu u prucessu tecnicu è i migliuramenti architetturali. U Mali-G77 pò avè da 7 à 16 core (scaling da 1 à 32 hè pussibule in u futuru), è ognunu di elli hè quasi a stessa dimensione di u G76. In cunseguenza, i smartphones high-end prubabilmente presentanu u listessu numeru di core GPU.
In i ghjoculi, pudete aspittà megliurenze di u rendiment trà 20 è 40%, secondu u tipu di carica di travagliu graficu. A ghjudicà da i risultati di a famosa prova Manhattan GFXBench, a superiorità significativa di a nova GPU annantu à a generazione attuale forzarà u rival Qualcomm à preoccupassi di una mellura significativa in u rendiment graficu Adreno.
Per sè stessu, a nova architettura Mali-G77 furnisce una migliione media di 30 per centu in l'efficienza energetica o u rendiment, dice ARM. A seconda generazione di l'architettura scalare ARM Valhall permette à a GPU di eseguisce 16 instructions per ciclu in parallelu nantu à u CU, cumparatu à ottu in u Bifrost (Mali-G76). Altre innovazioni includenu una pianificazione dinamica di l'istruzzioni cumpletamente guidata da hardware è un set d'istruzzioni cumpletamente novu mantenendu a cumpatibilità inversa cù Bifrost. U supportu per u formatu di compressione ARM AFBC1.3 è altre innovazioni (obiettivi di rendering FP16, rendering in strati è output di vertex shader) sò stati ancu aghjuntu.
U Bifrost CU cuntene 3 mutori di esecuzione, ognunu di i quali include una cache d'istruzzioni, un registru è una unità di cuntrollu Warp. A distribuzione in questi trè motori hà permessu di eseguisce 24 istruzioni FMA à una precisione di 32-bit in virgule flottante (FP32). In Valhall, ogni CU hà solu un mutore di esecuzione, divisu trà duie unità di calculu capaci di processà 16 istruzioni Warp per clock, chì risultanu in un throughput totale di 32 istruzioni FMA FP32 per CU. Grazie à questi cambiamenti architetturali, Mali-G77 pò esse realizatu un terzu di più calculi matematichi in calculi paralleli cumparatu cù Mali-G76.
Inoltre, ognuna di queste CU cuntene dui novi blocchi di funzioni matematiche. U novu mutore di cunversione (CVT) gestisce l'istruzzioni di basa integer, logica, branche è cunversione. L'unità di funzione speciale (SFU) accelera a multiplicazione intera, a divisione, a radica quadrata, i logaritmi è altre funzioni intere cumplesse.
U bloccu FMA standard hà parechje paràmetri chì supportanu 16 istruzioni FP32 per ciclu, 32 per FP16, o 64 per INT8 Dot Product. Queste ottimisazioni ponu furnisce finu à u 60% di migliurà di rendiment in l'applicazioni di apprendimentu di machine.
Un altru cambiamentu chjave in u Mali-G77 hè u radduppiamentu di u rendiment di u mutore di texture, chì avà processa 4 texels bilineari per clock paragunatu à i dui precedenti, 2 texels trilineari per clock, chì permette un filtru FP16 è FP32 più veloce.
ARM hà fattu una quantità di altri cambiamenti, cù u Mali-G77 è u Valhall chì prumettenu miglioramenti significativi di rendiment per i carichi di travagliu di ghjocu è machine learning. Impurtante, u cunsumu di energia è l'area di chip sò mantinuti à i livelli di Bifrost, prumettenu i dispositi mobili cù un rendimentu di punta più altu senza aumentà u cunsumu di energia, a dissipazione di calore è i requisiti di dimensione.
Source: 3dnews.ru