NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

A NVIDIA apresentou a nova geração de placas gráficas para jogos Ampere em 1º de setembro, mas a apresentação inicial quase não continha detalhes técnicos. Agora, alguns dias depois, a empresa lançou uma documentação que esclarece de onde vem a impressionante vantagem de desempenho que diferencia as placas gráficas GeForce RTX série 30 de suas antecessoras.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

Muitos notaram imediatamente que as especificações oficiais da GeForce RTX 3090, GeForce RTX 3080 e GeForce RTX 3070 no site da NVIDIA indicavam um número surpreendentemente grande de processadores CUDA.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

Acontece que a duplicação do desempenho FP32 dos processadores de jogos Ampere em comparação com Turing realmente ocorre e está associada a uma mudança na arquitetura dos blocos de construção básicos da GPU - processadores de fluxo (SM).

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

Enquanto os SMs nas GPUs da geração Turing tinham um caminho computacional para operações de ponto flutuante, em Ampere cada processador de fluxo recebeu dois caminhos, que no total podem realizar até 128 operações FMA por ciclo de clock contra 64 para Turing. Ao mesmo tempo, metade das unidades de execução Ampere disponíveis são capazes de realizar operações inteiras (INT) e operações de ponto flutuante de 32 bits (FP32), enquanto a segunda metade dos dispositivos é destinada exclusivamente a operações FP32. Essa abordagem foi usada para economizar o orçamento do transistor, com base no fato de que a carga do jogo gera significativamente mais FP32 do que operações INT. No entanto, em Turing não havia nenhum atuador combinado.


NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

Ao mesmo tempo, para fornecer aos processadores de fluxo aprimorados a quantidade necessária de dados, a NVIDIA aumentou o tamanho do cache L1 no SM em um terço (de 96 para 128 KB) e também dobrou seu rendimento.

Outra melhoria importante no Ampere é que os núcleos CUDA, RT e Tensor agora podem funcionar totalmente em paralelo. Isso permite que o mecanismo gráfico, por exemplo, use DLSS para dimensionar um quadro e, ao mesmo tempo, calcular o próximo quadro em núcleos CUDA e RT, reduzindo o tempo de inatividade dos nós funcionais e aumentando o desempenho geral.

A isto devemos acrescentar que os núcleos RT de segunda geração, implementados em Amrere, podem calcular interseções de triângulos com raios duas vezes mais rápido do que acontecia em Turing. E os novos núcleos tensores de terceira geração dobraram o desempenho matemático ao trabalhar com matrizes esparsas.

Dobrar a velocidade com que Ampere calcula interseções de triângulos deve ter um impacto significativo no desempenho dos aceleradores GeForce RTX série 30 em jogos que suportam ray tracing. Segundo a NVIDIA, foi essa característica que atuou como gargalo na arquitetura Turing, enquanto a velocidade dos cálculos das interseções dos raios dos paralelepípedos delimitadores não suscitou reclamações. Agora o equilíbrio do desempenho no traçado foi otimizado e, além disso, no Ampere, ambos os tipos de operações de raios (com triângulos e paralelepípedos) podem ser realizados em paralelo.

Além disso, novas funcionalidades foram adicionadas aos núcleos RT do Ampere para interpolar a posição dos triângulos. Isto pode ser usado para desfocar objetos em movimento quando nem todos os triângulos na cena estão em uma posição constante.

Para ilustrar tudo isso, a NVIDIA mostrou uma comparação direta de como as GPUs Turing e Ampere lidam com o ray tracing em Wolfenstein Youngblood em resolução 4K. Como segue na ilustração apresentada, Ampere se beneficia visivelmente na velocidade de construção de quadros, tanto devido aos cálculos matemáticos FP32 mais rápidos, graças aos núcleos RT de segunda geração, quanto à operação paralela de recursos de GPU heterogêneos.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

Além disso, para reforçar praticamente o acima exposto, a NVIDIA apresentou resultados de testes adicionais para a GeForce RTX 3090, GeForce RTX 3080 e GeForce RTX 3070. Segundo eles, a GeForce RTX 3070 está aproximadamente 60% à frente da GeForce RTX 2070 na resolução 1440p, e esse quadro é observado em jogos com suporte RTX, e com rasterização tradicional, em especial em Borderlands 3.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

O desempenho da GeForce RTX 3080 é duas vezes melhor que o da GeForce RTX 2080 em resolução 4K. É verdade que, neste caso, em Borderlands 3 sem suporte RTX, a vantagem da nova placa não é o dobro, mas aproximadamente 80 por cento.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

E a placa mais antiga, GeForce RTX 3090, nos próprios testes da NVIDIA mostra uma vantagem de aproximadamente uma vez e meia sobre a Titan RTX.

NVIDIA explicou por que os aceleradores da série GeForce RTX 30 têm um salto tão grande no desempenho

De acordo com relatos de jornalistas de tecnologia, análises completas do design de referência da GeForce RTX 3080 deverão ser publicadas em 14 de setembro. Três dias depois, no dia 17 de setembro, será permitida a publicação de dados de testes dos modelos de produção GeForce RTX 3080 dos parceiros da empresa. Assim, resta muito pouco tempo para esperar que os resultados dos testes independentes dos representantes da série GeForce RTX 30 apareçam na Internet.

Fonte:



Fonte: 3dnews.ru

Adicionar um comentário