Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Μαζί με τον νέο πυρήνα επεξεργαστή Cortex-A77 Η ARM παρουσίασε έναν επεξεργαστή γραφικών που έχει σχεδιαστεί για νέας γενιάς κινητά συστήματα ενός τσιπ. Mali-G77, το οποίο δεν πρέπει να συγχέεται με τον νέο επεξεργαστή οθόνης Mali-D77, σηματοδοτεί τη μετάβαση από την αρχιτεκτονική ARM Bifrost στο Valhall.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η ARM δηλώνει σημαντική αύξηση στην απόδοση γραφικών του Mali-G77 - κατά 40% σε σύγκριση με την τρέχουσα γενιά του Mali-G76. Αυτό επιτεύχθηκε τόσο μέσω της τεχνικής διαδικασίας όσο και μέσω των αρχιτεκτονικών βελτιώσεων. Το Mali-G77 μπορεί να έχει από 7 έως 16 πυρήνες (η κλιμάκωση από 1 έως 32 είναι δυνατή στο μέλλον) και καθένας από αυτούς έχει σχεδόν το ίδιο μέγεθος με το G76. Κατά συνέπεια, τα high-end smartphones θα διαθέτουν πιθανότατα τον ίδιο αριθμό πυρήνων GPU.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Στα παιχνίδια, μπορείτε να περιμένετε βελτιώσεις απόδοσης μεταξύ 20 και 40%, ανάλογα με τον τύπο του φόρτου εργασίας των γραφικών. Κρίνοντας από τα αποτελέσματα της δημοφιλούς δοκιμής Manhattan GFXBench, η σημαντική υπεροχή της νέας GPU σε σχέση με την τρέχουσα γενιά θα αναγκάσει τον αντίπαλο Qualcomm να ανησυχεί για μια σημαντική βελτίωση στην απόδοση γραφικών Adreno.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Από μόνη της, η νέα αρχιτεκτονική Mali-G77 προσφέρει κατά μέσο όρο 30 τοις εκατό βελτίωση στην απόδοση ισχύος ή στην απόδοση, λέει η ARM. Η δεύτερη γενιά της βαθμωτής αρχιτεκτονικής ARM Valhall επιτρέπει στη GPU να εκτελεί 16 εντολές ανά κύκλο παράλληλα στη CU, σε σύγκριση με οκτώ στο Bifrost (Mali-G76). Άλλες καινοτομίες περιλαμβάνουν δυναμικό προγραμματισμό εντολών που βασίζεται πλήρως στο υλικό και ένα εντελώς νέο σύνολο εντολών διατηρώντας παράλληλα τη συμβατότητα προς τα πίσω με το Bifrost. Προστέθηκε επίσης υποστήριξη για τη μορφή συμπίεσης ARM AFBC1.3 και άλλες καινοτομίες (στόχοι απόδοσης FP16, απόδοση σε επίπεδα και έξοδοι σκίασης κορυφής).


Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Το Bifrost CU περιείχε 3 μηχανές εκτέλεσης, καθένας από τους οποίους περιλάμβανε μια κρυφή μνήμη εντολών, έναν καταχωρητή και μια μονάδα ελέγχου Warp. Η κατανομή σε αυτούς τους τρεις κινητήρες επέτρεψε την εκτέλεση 24 εντολών FMA με ακρίβεια κινητής υποδιαστολής 32 bit (FP32). Στο Valhall, κάθε CU έχει μόνο έναν κινητήρα εκτέλεσης, χωρισμένο σε δύο υπολογιστικές μονάδες ικανές να επεξεργάζονται 16 εντολές Warp ανά ρολόι, με αποτέλεσμα μια συνολική απόδοση 32 εντολών FMA FP32 ανά CU. Χάρη σε αυτές τις αρχιτεκτονικές αλλαγές, το Mali-G77 μπορεί να εκτελέσει κατά το ένα τρίτο περισσότερους μαθηματικούς υπολογισμούς σε παράλληλους υπολογισμούς σε σύγκριση με το Mali-G76.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Επιπλέον, κάθε ένα από αυτά τα CU περιέχει δύο νέα μπλοκ μαθηματικών συναρτήσεων. Η νέα μηχανή μετατροπής (CVT) χειρίζεται βασικές οδηγίες ακέραιου αριθμού, λογικής, διακλάδωσης και μετατροπής. Η μονάδα ειδικής συνάρτησης (SFU) επιταχύνει τον πολλαπλασιασμό ακεραίων, τη διαίρεση, την τετραγωνική ρίζα, τους λογάριθμους και άλλες σύνθετες ακέραιες συναρτήσεις.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Το τυπικό μπλοκ FMA έχει πολλές ρυθμίσεις που υποστηρίζουν 16 οδηγίες FP32 ανά κύκλο, 32 για FP16 ή 64 για INT8 Dot Product. Αυτές οι βελτιστοποιήσεις μπορούν να προσφέρουν έως και 60% βελτιώσεις απόδοσης σε εφαρμογές μηχανικής εκμάθησης.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Μια άλλη βασική αλλαγή στο Mali-G77 είναι ο διπλασιασμός της απόδοσης του κινητήρα υφής, ο οποίος επεξεργάζεται τώρα 4 διγραμμικά texel ανά ρολόι σε σύγκριση με τα δύο προηγούμενα, 2 τριγραμμικά texel ανά ρολόι, επιτρέποντας ταχύτερο φιλτράρισμα FP16 και FP32.

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η GPU ARM Mali-G77 είναι 40% ταχύτερη

Η ARM έχει κάνει πολλές άλλες αλλαγές, με τα Mali-G77 και Valhall να υπόσχονται σημαντικές βελτιώσεις στην απόδοση για φόρτους εργασίας παιχνιδιών και μηχανικής εκμάθησης. Είναι σημαντικό ότι η κατανάλωση ενέργειας και η περιοχή των τσιπ διατηρούνται σε επίπεδα Bifrost, υποσχόμενες φορητές συσκευές με υψηλότερη απόδοση αιχμής χωρίς αυξημένη κατανάλωση ενέργειας, απαγωγή θερμότητας και απαιτήσεις μεγέθους.



Πηγή: 3dnews.ru

Προσθέστε ένα σχόλιο