NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

NVIDIA a présenté la nouvelle génération de cartes graphiques de jeu Ampere le 1er septembre, mais la présentation initiale ne contenait quasiment aucun détail technique. Aujourd'hui, quelques jours plus tard, la société a publié une documentation qui précise d'où vient l'avantage impressionnant en termes de performances qui distingue les cartes graphiques GeForce RTX série 30 de leurs prédécesseurs.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Beaucoup ont immédiatement remarqué que les spécifications officielles des GeForce RTX 3090, GeForce RTX 3080 et GeForce RTX 3070 sur le site Web de NVIDIA indiquaient un nombre incroyablement élevé de processeurs CUDA.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Il s'avère que le doublement des performances FP32 des processeurs de jeu Ampere par rapport à Turing se produit effectivement, et il est associé à un changement dans l'architecture des éléments de base du GPU - les processeurs de flux (SM).

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Alors que les SM des GPU de la génération Turing disposaient d'un seul chemin de calcul pour les opérations en virgule flottante, dans Ampere, chaque processeur de flux recevait deux chemins, qui au total peuvent effectuer jusqu'à 128 opérations FMA par cycle d'horloge contre 64 pour Turing. Dans le même temps, la moitié des unités d'exécution Ampere disponibles sont capables d'effectuer à la fois des opérations sur des nombres entiers (INT) et des opérations à virgule flottante 32 bits (FP32), tandis que la seconde moitié des appareils est destinée exclusivement aux opérations FP32. Cette approche a été utilisée pour économiser le budget des transistors, sur la base du fait que la charge de jeu génère beaucoup plus d'opérations FP32 que les opérations INT. Cependant, à Turing, il n'y avait aucun actionneur combiné.


NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Dans le même temps, afin de fournir aux processeurs de flux améliorés la quantité de données nécessaire, NVIDIA a augmenté d'un tiers la taille du cache L1 dans SM (de 96 à 128 Ko) et a également doublé son débit.

Une autre amélioration importante d'Ampere est que les cœurs CUDA, RT et Tensor peuvent désormais fonctionner entièrement en parallèle. Cela permet au moteur graphique, par exemple, d'utiliser DLSS pour mettre à l'échelle une image et en même temps de calculer l'image suivante sur les cœurs CUDA et RT, réduisant ainsi les temps d'arrêt des nœuds fonctionnels et augmentant les performances globales.

À cela, il faut ajouter que les cœurs RT de deuxième génération, implémentés dans Amrere, peuvent calculer les intersections de triangles avec des rayons deux fois plus vite que dans Turing. Et les nouveaux noyaux tenseurs de troisième génération ont doublé les performances mathématiques lorsque l'on travaille avec des matrices clairsemées.

Doubler la vitesse à laquelle Ampere calcule les intersections des triangles devrait avoir un impact significatif sur les performances des accélérateurs GeForce RTX série 30 dans les jeux prenant en charge le lancer de rayons. Selon NVIDIA, c'est cette caractéristique qui a agi comme un goulot d'étranglement dans l'architecture de Turing, tandis que la vitesse de calcul des intersections des rayons des parallélépipèdes englobants n'a soulevé aucune plainte. Désormais, l'équilibre des performances en matière de traçage a été optimisé et, de plus, dans Ampère, les deux types d'opérations sur rayons (avec triangles et parallélépipèdes) peuvent être effectués en parallèle.

En plus de cela, une nouvelle fonctionnalité a été ajoutée aux cœurs RT d'Ampère pour interpoler la position des triangles. Cela peut être utilisé pour rendre flous les objets en mouvement lorsque tous les triangles de la scène ne sont pas dans une position constante.

Pour illustrer tout cela, NVIDIA a montré une comparaison directe de la façon dont les GPU Turing et Ampere gèrent le lancer de rayons dans Wolfenstein Youngblood à une résolution 4K. Comme il ressort de l'illustration présentée, Ampere bénéficie sensiblement de la vitesse de construction des images, à la fois grâce à des calculs mathématiques FP32 plus rapides, grâce aux cœurs RT de deuxième génération, ainsi qu'au fonctionnement parallèle de ressources GPU hétérogènes.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

De plus, pour renforcer pratiquement ce qui précède, NVIDIA a présenté des résultats de tests supplémentaires pour les GeForce RTX 3090, GeForce RTX 3080 et GeForce RTX 3070. Selon eux, la GeForce RTX 3070 a environ 60 % d'avance sur la GeForce RTX 2070 en résolution 1440p, et cette image s'observe dans les jeux avec support RTX, et avec rastérisation traditionnelle, en particulier dans Borderlands 3.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Les performances de la GeForce RTX 3080 sont deux fois supérieures à celles de la GeForce RTX 2080 en résolution 4K. Certes, dans ce cas, dans Borderlands 3 sans support RTX, l'avantage de la nouvelle carte n'est pas le double, mais environ 80 %.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Et l’ancienne carte, GeForce RTX 3090, dans les propres tests de NVIDIA montre environ une fois et demie d’avantage par rapport au Titan RTX.

NVIDIA a expliqué pourquoi les accélérateurs GeForce RTX de la série 30 ont un tel bond en performances

Selon les rapports des journalistes techniques, des critiques complètes du design de référence GeForce RTX 3080 devraient être publiées le 14 septembre. Trois jours plus tard, le 17 septembre, il sera autorisé à publier les données de test des modèles de production GeForce RTX 3080 des partenaires de l'entreprise. Ainsi, il reste très peu de temps pour attendre que les résultats des tests indépendants des représentants de la série GeForce RTX 30 apparaissent sur Internet.

Source:



Source: 3dnews.ru

Ajouter un commentaire