GPU ARM Mali-G77 é 40% mais rápida

Junto com o novo núcleo do processador Cortex-A77 A ARM introduziu um processador gráfico projetado para sistemas móveis de chip único de próxima geração. Mali-G77, que não deve ser confundido com o novo processador de exibição Mali-D77, marca a transição da arquitetura ARM Bifrost para Valhall.

GPU ARM Mali-G77 é 40% mais rápida

ARM declara um aumento significativo no desempenho gráfico do Mali-G77 - em 40% em comparação com a geração atual do Mali-G76. Isto foi conseguido tanto através do processo técnico quanto de melhorias arquitetônicas. O Mali-G77 pode ter de 7 a 16 núcleos (é possível dimensionar de 1 a 32 no futuro), e cada um deles tem quase o mesmo tamanho do G76. Consequentemente, os smartphones topo de linha provavelmente apresentarão o mesmo número de núcleos de GPU.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

Nos jogos, você pode esperar melhorias de desempenho entre 20 e 40%, dependendo do tipo de carga de trabalho gráfico. A julgar pelos resultados do popular teste Manhattan GFXBench, a superioridade significativa da nova GPU sobre a geração atual forçará a rival Qualcomm a se preocupar com uma melhoria significativa no desempenho gráfico do Adreno.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

Por si só, a nova arquitetura Mali-G77 oferece uma melhoria média de 30% na eficiência energética ou no desempenho, afirma a ARM. A segunda geração da arquitetura escalar ARM Valhall permite que a GPU execute 16 instruções por ciclo em paralelo na CU, em comparação com oito no Bifrost (Mali-G76). Outras inovações incluem agendamento dinâmico de instruções totalmente orientado por hardware e um conjunto de instruções completamente novo, mantendo a compatibilidade com versões anteriores do Bifrost. Suporte para o formato de compressão ARM AFBC1.3 e outras inovações (alvos de renderização FP16, renderização em camadas e saídas de sombreador de vértice) também foram adicionados.


GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

O Bifrost CU continha 3 motores de execução, cada um dos quais incluía um cache de instruções, um registro e uma unidade de controle Warp. A distribuição entre esses três motores permitiu que 24 instruções FMA fossem executadas com precisão de ponto flutuante de 32 bits (FP32). No Valhall, cada CU possui apenas um mecanismo de execução, dividido entre duas unidades de computação capazes de processar 16 instruções Warp por clock, resultando em um rendimento total de 32 instruções FMA FP32 por CU. Graças a estas mudanças arquitetónicas, o Mali-G77 pode realizar um terço mais cálculos matemáticos em cálculos paralelos em comparação com o Mali-G76.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

Além disso, cada uma dessas UCs ​​contém dois novos blocos de funções matemáticas. O novo mecanismo de conversão (CVT) lida com instruções básicas de números inteiros, lógicos, de ramificação e de conversão. A Unidade de Função Especial (SFU) acelera a multiplicação, divisão, raiz quadrada, logaritmos e outras funções inteiras complexas.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

O bloco FMA padrão possui várias configurações que suportam 16 instruções FP32 por ciclo, 32 para FP16 ou 64 para INT8 Dot Product. Essas otimizações podem fornecer melhorias de desempenho de até 60% em aplicativos de aprendizado de máquina.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

Outra mudança importante no Mali-G77 é a duplicação do desempenho do mecanismo de textura, que agora processa 4 texels bilineares por clock em comparação com os dois anteriores, 2 texels trilineares por clock, permitindo uma filtragem FP16 e FP32 mais rápida.

GPU ARM Mali-G77 é 40% mais rápida

GPU ARM Mali-G77 é 40% mais rápida

A ARM fez uma série de outras mudanças, com o Mali-G77 e o Valhall prometendo melhorias significativas de desempenho para cargas de trabalho de jogos e aprendizado de máquina. É importante ressaltar que o consumo de energia e a área do chip são mantidos nos níveis Bifrost, prometendo dispositivos móveis com desempenho de pico mais alto sem aumentar o consumo de energia, a dissipação de calor e os requisitos de tamanho.



Fonte: 3dnews.ru

Adicionar um comentário