Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Depois que a NVIDIA demonstrou o ray tracing em tempo real nas placas de vídeo da série GeForce RTX, é difícil duvidar que esta tecnologia (em combinação razoável com o algoritmo de rasterização) seja o futuro dos jogos de computador. No entanto, GPUs baseadas na arquitetura Turing com núcleos RT especializados eram até recentemente consideradas a única categoria de GPUs discretas que possuem o poder de computação adequado para isso.

Como mostraram os testes dos primeiros jogos que dominaram o Ray Tracing (Battlefield V, Metro Exodus e Shadow of the Tomb Raider), até mesmo os aceleradores GeForce RTX (especialmente o mais novo deles, o RTX 2060) experimentam uma queda significativa nas taxas de quadros em tarefas de renderização híbrida. Apesar dos sucessos iniciais, o ray tracing em tempo real ainda não é uma tecnologia madura. Só quando não só os dispositivos mais avançados e caros, mas também as placas gráficas de gama média atingirem os mesmos padrões de desempenho na nova vaga de jogos, será possível declarar que a mudança de paradigma lançada pela empresa de Jensen Huang finalmente aconteceu.

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Ray tracing em Pascal - prós e contras

Mas agora, embora nenhuma palavra tenha sido dita sobre o futuro sucessor da arquitetura Turing, a NVIDIA decidiu estimular o progresso. No evento GPU Technology Conference no mês passado, a equipe verde anunciou que os aceleradores em chips Pascal, bem como os membros de gama baixa da família Turing (série GeForce GTX 16), ganharão funcionalidade de ray tracing em tempo real no mesmo nível do RTX -produtos de marca. Hoje, o driver prometido já pode ser baixado no site oficial da NVIDIA, e a lista de dispositivos inclui modelos da família GeForce 10, começando pela GeForce GTX 1060 (versão de 6 GB), o acelerador profissional TITAN V no chip Volta, e, claro, modelos recém-chegados na categoria de preço médio no chip TU116 - GeForce GTX 1660 e GTX 1660 Ti. A atualização também afetou laptops com GPUs correspondentes.

Do ponto de vista técnico, não há nada de sobrenatural aqui. GPUs com unidades de shader unificadas eram capazes de realizar Ray Tracing muito antes do advento da arquitetura Turing, embora naquela época não fossem rápidas o suficiente para que esse recurso fosse exigido em jogos. Além disso, não havia um padrão uniforme para métodos de software, exceto APIs fechadas, como a NVIDIA OptiX proprietária. Agora que existe uma extensão DXR para Direct3D 12 e bibliotecas semelhantes na interface de programação Vulkan, o mecanismo de jogo pode acessá-los independentemente de a GPU estar equipada com lógica especializada, desde que o driver forneça essa capacidade. Os chips Turing têm núcleos RT separados para essa finalidade, e na GPU da arquitetura Pascal e no processador TU116, o traçado de raio é implementado em um formato de computação de uso geral em uma matriz de ALUs de shader.

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

No entanto, tudo o que sabemos sobre a arquitetura Turing da própria NVIDIA sugere que Pascal não é adequado para aplicações habilitadas para DXR. Na apresentação do ano passado dedicada aos principais modelos da família Turing - GeForce RTX 2080 e RTX 2080 Ti - os engenheiros apresentaram os seguintes cálculos. Se você colocar todos os recursos da melhor placa gráfica de consumo de última geração – a GeForce GTX 1080 Ti – em cálculos de ray tracing, o desempenho resultante não excederá 11% do que a RTX 2080 Ti é teoricamente capaz. Igualmente importante é que os núcleos CUDA livres do chip Turing podem ser usados ​​​​ao mesmo tempo para processamento paralelo de outros componentes de imagem - execução de programas de shader, fila de cálculos Direct3D não gráficos durante execução assíncrona e assim por diante.

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Em jogos reais, a situação é mais complicada, porque no hardware existente os desenvolvedores usam funções DXR em doses, e a maior parte da carga de computação ainda é ocupada por instruções de rasterização e shader. Além disso, alguns dos vários efeitos criados usando ray tracing também podem ser bem executados nos núcleos CUDA dos chips Pascal. Por exemplo, as superfícies espelhadas no Battlefield V não implicam reflexão secundária de raios e, portanto, são uma carga viável para placas de vídeo poderosas da geração anterior. O mesmo se aplica às sombras em Shadow of the Tomb Raider, embora renderizar sombras complexas formadas por múltiplas fontes de luz já seja uma tarefa mais difícil. Mas a cobertura global do Metro Exodus é difícil mesmo para Turing, e não se pode esperar que Pascal produza resultados comparáveis ​​em qualquer medida.

Goste ou não, estamos falando de uma diferença múltipla no desempenho teórico entre representantes da arquitetura Turing e seus análogos mais próximos no silício Pascal. Além disso, não apenas a presença de núcleos RT, mas também inúmeras melhorias gerais características dos aceleradores de nova geração jogam a favor de Turing. Assim, os chips Turing podem realizar operações paralelas em dados reais (FP32) e inteiros (INT), carregar uma grande quantidade de memória cache local e separar núcleos CUDA para cálculos de precisão reduzida (FP16). Tudo isso significa que Turing não apenas lida melhor com programas de shader, mas também pode calcular o traçado de raio de forma relativamente eficiente, sem blocos especializados. Afinal, o que torna a renderização usando Ray Tracing tão intensiva em recursos não é apenas e nem tanto a busca por interseções entre raios e elementos geométricos (o que os núcleos RT fazem), mas o cálculo da cor no ponto de interseção (sombreamento). E, a propósito, as vantagens listadas da arquitetura Turing se aplicam totalmente à GeForce GTX 1660 e GTX 1660 Ti, embora o chip TU116 não possua núcleos RT, portanto, os testes dessas placas de vídeo com software ray tracing são de particular interesse.

Mas chega de teoria, porque já coletamos dados sobre o desempenho de “Pascals” (assim como de “Turings” mais jovens) em Battlefield V, Metro Exodus e Shadow of the Tomb Raider com base em nossas próprias medições. Observe que nem o driver nem os próprios jogos ajustam o número de raios para reduzir a carga em GPUs sem núcleos RT, o que significa que a qualidade dos efeitos na GeForce GTX e GeForce RTX deve ser a mesma.

Bancada de teste, metodologia de teste

bancada de teste
CPU Intel Core i9-9900K (4,9 GHz, 4,8 GHz AVX, frequência fixa)
Placa-mãe ASUS MAXIMUS XI APEX
Memória operativa G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ПЗУ SSD Intel 760p, 1024 GB
Unidade de fornecimento de energia Corsário AX1200i, 1200W
Sistema de resfriamento da CPU Corsair Hydro Série H115i
habitação Bancada de testes CoolerMaster V1.0
Monitor NEC EA244UHD
Sistema operacional Janelas 10 Pro x64
Software de GPU NVIDIA
NVIDIA GeForce RTX 20 Driver NVIDIA GeForce Game Ready 419.67
NVIDIA GeForce GTX 10/16 Driver NVIDIA GeForce Game Ready 425.31
Testes de jogo
O jogo API Configurações, método de teste Anti-aliasing em tela cheia
1920 × 1080 / 2560 × 1440 × 3840 2160
Campo de batalha v DirectX 12 OCAT, missão Liberte. Máx. qualidade grafica TAA alto TAA alto
Êxodo de Metro DirectX 12 Referência integrada. Perfil de qualidade ultragráfico TAA TAA
Shadow of the Tomb Raider DirectX 12 Referência integrada. Máx. qualidade grafica SMAA 4x Desligado

Os indicadores de taxas de quadros médias e mínimas são derivados da matriz de tempos de renderização de quadros individuais, que é registrada pelo benchmark integrado (Metro Exodus, Shadow of the Tomb Raider) ou pelo utilitário OCAT, se o jogo não tiver um (Campo de Batalha V).

A taxa de quadros média nos gráficos é o inverso do tempo médio de quadros. Para estimar a taxa de quadros mínima, é calculado o número de quadros formados em cada segundo do teste. Desta matriz de números, é selecionado o valor correspondente ao 1º percentil da distribuição.

Participantes do teste

As seguintes placas de vídeo participaram dos testes de desempenho:

  • NVIDIA GeForce RTX 2080 Ti Founders Edition (1350/14000 MHz, 11 GB);
  • NVIDIA GeForce GTX 2080 Founders Edition (1515/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2070 Founders Edition (1410/14000 MHz, 8 GB);
  • NVIDIA GeForce RTX 2060 Founders Edition (1365/14000 MHz, 6 GB);
  • NVIDIA GeForce GTX 1660 Ti (6 GB);
  • NVIDIA GeForce GTX 1660 (6 GB);
  • NVIDIA GeForce GTX 1080 Ti (1480/11000 MHz, 11 GB);
  • NVIDIA GeForce GTX 1080 (1607/10000 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 Ti (1608/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1070 (1506/8008 MHz, 8 GB);
  • NVIDIA GeForce GTX 1060 (1506/9000 MHz, 6 GB).

Campo de batalha v

Devido ao fato de Battlefield V em si ser um jogo bastante leve (especialmente nos modos 1080p e 1440p) e usar ray tracing em patches, testar a série GeForce 10 com a opção DXR produziu resultados encorajadores. No entanto, de todos os modelos sem suporte para Ray Tracing no nível do silício, tivemos que nos limitar aos modelos GTX 1070/1070 Ti e GTX 1080/1080 Ti. Os jogos da Electronic Arts reagem com desconfiança às mudanças frequentes na configuração do hardware e bloqueiam o usuário por um período de um ou vários dias. Portanto, as medições de desempenho da GeForce GTX 1060 e de dois dispositivos da série GeForce GTX 16 aparecerão neste artigo posteriormente, assim que Battlefield V remover as restrições de nossa máquina de teste.

Em termos percentuais, qualquer um dos participantes do teste experimentou aproximadamente a mesma queda no desempenho em várias configurações de qualidade de traçado de raio, independentemente da resolução da tela. Assim, o desempenho das placas de vídeo da marca GeForce RTX 20 diminui em 28–43% com efeitos DXR de baixa e média qualidade e em 37–53% com qualidade alta e máxima.

Se estamos falando de modelos mais antigos da família GeForce 10, então nos níveis de ray tracing Baixo e Médio o jogo perde de 36 a 42% de FPS, e em alta qualidade (configurações High e Ultra) o DXR já consome 54-67 % da taxa de quadros. Observe que em muitas, senão na maioria, das cenas do jogo Battlefield V, não há diferença perceptível entre as configurações Baixa e Média, ou entre Alta e Ultra, em termos de clareza de imagem ou desempenho. Na esperança de que as GPUs Pascal fossem mais sensíveis a esta configuração, executamos testes em todas as quatro configurações. Na verdade, algumas diferenças apareceram, mas apenas na resolução de 2160p e dentro de 6% de FPS.

Em termos absolutos, qualquer um dos aceleradores mais antigos em chips Pascal pode manter taxas de quadros acima de 60 FPS no modo 1080p com qualidade de reflexão reduzida, e a GeForce GTX 1080 Ti afirma um resultado semelhante mesmo quando rastreada no nível Alto. Mas quando você muda para a resolução de 1440p, apenas a GeForce GTX 1080 e GTX 1080 Ti fornecem uma taxa de quadros confortável de 60 FPS ou superior com qualidade de traçado de raio baixa ou média e, no modo 4K, nenhuma das placas da geração anterior tem poder de computação adequado ( como, de fato, qualquer Turing, com exceção da carro-chefe GeForce RTX 2080 Ti).

Se procurarmos paralelos entre aceleradores específicos das marcas GeForce GTX 10 e GeForce RTX 20, então o melhor modelo da geração anterior (GeForce GTX 1080 Ti), que é um análogo da GeForce RTX 2080 em tarefas de renderização padrão sem DXR, caiu para o nível da GeForce RTX 2070 com ray tracing de qualidade reduzida, e em níveis altos só consegue brigar com a GeForce RTX 2060.

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Campo de Batalha V, máx. Qualidade
1920×1080 TAA
RT desativado TR baixo RT médio TR alto RT ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8GB) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8GB) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Campo de Batalha V, máx. Qualidade
2560×1440 TAA
RT desativado TR baixo RT médio TR alto RT ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8GB) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8GB) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Novo artigo: GeForce RTX não é mais necessária? Testes de rastreamento de raio em aceleradores GeForce GTX 10 e 16

Campo de Batalha V, máx. Qualidade
3840×2160 TAA
RT desativado TR baixo RT médio TR alto RT ultra
NVIDIA GeForce RTX 2080 Ti FE (11 GB) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 GB) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 GB) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 GB) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1660 (6GB) 100% ND ND ND ND
NVIDIA GeForce GTX 1080 Ti (11 GB) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8GB) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 GB) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8GB) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6GB) 100% ND ND ND ND

Fonte: 3dnews.ru

Adicionar um comentário