Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Η NVIDIA παρουσίασε τη νέα γενιά καρτών γραφικών παιχνιδιών Ampere την 1η Σεπτεμβρίου, αλλά η αρχική παρουσίαση δεν περιείχε σχεδόν καμία τεχνική λεπτομέρεια. Τώρα, λίγες μέρες αργότερα, η εταιρεία δημοσίευσε τεκμηρίωση που διευκρινίζει από πού προέρχεται το εντυπωσιακό πλεονέκτημα απόδοσης που ξεχωρίζει τις κάρτες γραφικών της σειράς GeForce RTX 30 από τους προκατόχους τους.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Πολλοί παρατήρησαν αμέσως ότι οι επίσημες προδιαγραφές των GeForce RTX 3090, GeForce RTX 3080 και GeForce RTX 3070 στον ιστότοπο της NVIDIA έδειχναν έναν εκπληκτικά μεγάλο αριθμό επεξεργαστών CUDA.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Όπως αποδεικνύεται, ο διπλασιασμός της απόδοσης FP32 των επεξεργαστών gaming Ampere σε σύγκριση με τον Turing συμβαίνει πράγματι και σχετίζεται με μια αλλαγή στην αρχιτεκτονική των βασικών δομικών στοιχείων των επεξεργαστών ροής GPU (SM).

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Ενώ οι SM στις GPU της γενιάς Turing είχαν μια υπολογιστική διαδρομή για λειτουργίες κινητής υποδιαστολής, σε Ampere κάθε επεξεργαστής ροής έλαβε δύο διαδρομές, οι οποίες συνολικά μπορούν να εκτελέσουν έως και 128 λειτουργίες FMA ανά κύκλο ρολογιού έναντι 64 για τον Turing. Ταυτόχρονα, οι μισές από τις διαθέσιμες μονάδες εκτέλεσης Ampere μπορούν να εκτελούν λειτουργίες ακέραιου αριθμού (INT) και λειτουργιών κινητής υποδιαστολής 32 bit (FP32), ενώ το δεύτερο μισό των συσκευών προορίζεται αποκλειστικά για λειτουργίες FP32. Αυτή η προσέγγιση χρησιμοποιήθηκε για την εξοικονόμηση του προϋπολογισμού του τρανζίστορ, με βάση το γεγονός ότι το φορτίο του παιχνιδιού παράγει σημαντικά περισσότερα FP32 από τις λειτουργίες INT. Ωστόσο, στο Turing δεν υπήρχαν καθόλου συνδυασμένοι ενεργοποιητές.


Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Ταυτόχρονα, για να παρέχει στους βελτιωμένους επεξεργαστές ροής τον απαραίτητο όγκο δεδομένων, η NVIDIA αύξησε το μέγεθος της κρυφής μνήμης L1 στο SM κατά ένα τρίτο (από 96 σε 128 KB) και διπλασίασε την απόδοσή της.

Μια άλλη σημαντική βελτίωση στο Ampere είναι ότι οι πυρήνες CUDA, RT και Tensor μπορούν πλέον να λειτουργούν πλήρως παράλληλα. Αυτό επιτρέπει στη μηχανή γραφικών, για παράδειγμα, να χρησιμοποιεί DLSS για να κλιμακώνει ένα καρέ και ταυτόχρονα να υπολογίζει το επόμενο καρέ στους πυρήνες CUDA και RT, μειώνοντας το χρόνο διακοπής λειτουργίας των λειτουργικών κόμβων και αυξάνοντας τη συνολική απόδοση.

Σε αυτό πρέπει να προσθέσουμε ότι οι πυρήνες RT δεύτερης γενιάς, που υλοποιούνται στο Amrere, μπορούν να υπολογίσουν τις τομές τριγώνων με ακτίνες δύο φορές πιο γρήγορα από ό,τι στο Turing. Και οι νέοι πυρήνες τανυστών τρίτης γενιάς έχουν διπλασιάσει τη μαθηματική απόδοση κατά την εργασία με αραιούς πίνακες.

Ο διπλασιασμός της ταχύτητας με την οποία το Ampere υπολογίζει τις τομές τριγώνων θα πρέπει να έχει σημαντικό αντίκτυπο στην απόδοση των επιταχυντών της σειράς GeForce RTX 30 σε παιχνίδια που υποστηρίζουν ανίχνευση ακτίνων. Σύμφωνα με την NVIDIA, αυτό το χαρακτηριστικό ήταν που λειτούργησε ως εμπόδιο στην αρχιτεκτονική Turing, ενώ η ταχύτητα υπολογισμού των τομών ακτίνων οριοθετημένων παραλληλεπίπεδων δεν προκάλεσε κανένα παράπονο. Τώρα η ισορροπία απόδοσης στην ανίχνευση έχει βελτιστοποιηθεί, και επιπλέον, στο Ampere, και οι δύο τύποι πράξεων ακτίνων (με τρίγωνα και παραλληλεπίπεδα) μπορούν να εκτελεστούν παράλληλα.

Επιπλέον, έχει προστεθεί νέα λειτουργικότητα στους πυρήνες RT του Ampere για παρεμβολή της θέσης των τριγώνων. Αυτό μπορεί να χρησιμοποιηθεί για να θολώσει αντικείμενα σε κίνηση όταν δεν βρίσκονται όλα τα τρίγωνα στη σκηνή σε σταθερή θέση.

Για να τα απεικονίσει όλα αυτά, η NVIDIA έδειξε μια άμεση σύγκριση του τρόπου με τον οποίο οι GPU Turing και Ampere χειρίζονται την ανίχνευση ακτίνων στο Wolfenstein Youngblood σε ανάλυση 4K. Όπως προκύπτει από την εικόνα που παρουσιάζεται, το Ampere επωφελείται αισθητά στην ταχύτητα κατασκευής πλαισίου τόσο λόγω των ταχύτερων μαθηματικών υπολογισμών FP32, χάρη στους πυρήνες RT δεύτερης γενιάς, όσο και λόγω της παράλληλης λειτουργίας ετερογενών πόρων GPU.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Επιπλέον, για να ενισχύσει πρακτικά τα παραπάνω, η NVIDIA παρουσίασε πρόσθετα αποτελέσματα δοκιμών για τα GeForce RTX 3090, GeForce RTX 3080 και GeForce RTX 3070. Σύμφωνα με αυτά, το GeForce RTX 3070 είναι περίπου 60% μπροστά από το GeForce RTX 2070 σε ανάλυση και αυτή η εικόνα παρατηρείται σε παιχνίδια με υποστήριξη RTX και με παραδοσιακή ραστεροποίηση, ιδιαίτερα στο Borderlands 1440.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Η απόδοση του GeForce RTX 3080 είναι διπλάσια από αυτή του GeForce RTX 2080 σε ανάλυση 4K. Είναι αλήθεια ότι σε αυτήν την περίπτωση, στο Borderlands 3 χωρίς υποστήριξη RTX, το πλεονέκτημα της νέας κάρτας δεν είναι διπλό, αλλά περίπου 80 τοις εκατό.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Και η παλαιότερη κάρτα, GeForce RTX 3090, στις δοκιμές της NVIDIA δείχνει περίπου μιάμιση φορά πλεονέκτημα έναντι της Titan RTX.

Η NVIDIA εξήγησε γιατί οι επιταχυντές της σειράς GeForce RTX 30 έχουν τέτοιο άλμα στην απόδοση

Σύμφωνα με αναφορές από δημοσιογράφους τεχνολογίας, οι πλήρεις αξιολογήσεις του σχεδιασμού αναφοράς GeForce RTX 3080 πρόκειται να δημοσιευτούν στις 14 Σεπτεμβρίου. Τρεις ημέρες αργότερα, στις 17 Σεπτεμβρίου, θα επιτραπεί η δημοσίευση δεδομένων δοκιμών για τα μοντέλα παραγωγής GeForce RTX 3080 από τους συνεργάτες της εταιρείας. Έτσι, απομένει πολύ λίγος χρόνος για να εμφανιστούν στο Διαδίκτυο τα αποτελέσματα των ανεξάρτητων δοκιμών των εκπροσώπων της σειράς GeForce RTX 30.

Πηγή:



Πηγή: 3dnews.ru

Προσθέστε ένα σχόλιο