GPU ARM Mali-G77 adalah 40% lebih pantas

Bersama dengan teras pemproses baharu Cortex-A77 ARM memperkenalkan pemproses grafik yang direka untuk sistem cip tunggal mudah alih generasi akan datang. Mali-G77, yang tidak boleh dikelirukan dengan pemproses paparan baharu Mali-D77, menandakan peralihan daripada seni bina ARM Bifrost ke Valhall.

GPU ARM Mali-G77 adalah 40% lebih pantas

ARM mengisytiharkan peningkatan ketara dalam prestasi grafik Mali-G77 - sebanyak 40% berbanding generasi semasa Mali-G76. Ini dicapai melalui proses teknikal dan penambahbaikan seni bina. Mali-G77 boleh mempunyai dari 7 hingga 16 teras (penskalaan dari 1 hingga 32 mungkin pada masa hadapan), dan setiap satu daripadanya hampir sama saiznya dengan G76. Akibatnya, telefon pintar mewah berkemungkinan akan menampilkan bilangan teras GPU yang sama.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Dalam permainan, anda boleh menjangkakan peningkatan prestasi antara 20 dan 40%, bergantung pada jenis beban kerja grafik. Berdasarkan keputusan ujian Manhattan GFXBench yang popular, keunggulan ketara GPU baharu berbanding generasi semasa akan memaksa pesaing Qualcomm bimbang tentang peningkatan ketara dalam prestasi grafik Adreno.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Dengan sendirinya, seni bina Mali-G77 baharu memberikan peningkatan purata 30 peratus dalam kecekapan atau prestasi kuasa, kata ARM. Generasi kedua seni bina skalar ARM Valhall membolehkan GPU melaksanakan 16 arahan setiap kitaran secara selari pada CU, berbanding lapan dalam Bifrost (Mali-G76). Inovasi lain termasuk penjadualan arahan dinamik dipacu perkakasan sepenuhnya dan set arahan yang benar-benar baharu sambil mengekalkan keserasian ke belakang dengan Bifrost. Sokongan untuk format mampatan ARM AFBC1.3 dan inovasi lain (sasaran pemaparan FP16, pemaparan berlapis dan output pelorek bucu) juga telah ditambah.


GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Bifrost CU mengandungi 3 enjin pelaksanaan, setiap satunya termasuk cache arahan, daftar dan unit kawalan Warp. Pengagihan merentas ketiga-tiga enjin ini membenarkan 24 arahan FMA dilaksanakan pada ketepatan titik terapung 32-bit (FP32). Di Valhall, setiap CU hanya mempunyai satu enjin pelaksanaan, dibahagikan antara dua unit pengiraan yang mampu memproses 16 arahan Warp setiap jam, menghasilkan jumlah daya pemprosesan sebanyak 32 arahan FMA FP32 setiap CU. Terima kasih kepada perubahan seni bina ini, Mali-G77 boleh melakukan satu pertiga lagi pengiraan matematik dalam pengiraan selari berbanding dengan Mali-G76.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Di samping itu, setiap CU ini mengandungi dua blok fungsi matematik baharu. Enjin penukaran baharu (CVT) mengendalikan integer asas, logik, cawangan dan arahan penukaran. Unit Fungsi Khas (SFU) mempercepatkan pendaraban integer, pembahagian, punca kuasa dua, logaritma dan fungsi integer kompleks yang lain.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Blok FMA standard mempunyai beberapa tetapan yang menyokong 16 arahan FP32 setiap kitaran, 32 untuk FP16 atau 64 untuk Produk Dot INT8. Pengoptimuman ini boleh memberikan sehingga 60% peningkatan prestasi dalam aplikasi pembelajaran mesin.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

Satu lagi perubahan utama dalam Mali-G77 ialah penggandaan prestasi enjin tekstur, yang kini memproses 4 bilinear texel setiap jam berbanding dua sebelumnya, 2 trilinear texel setiap jam, membolehkan penapisan FP16 dan FP32 yang lebih pantas.

GPU ARM Mali-G77 adalah 40% lebih pantas

GPU ARM Mali-G77 adalah 40% lebih pantas

ARM telah membuat beberapa perubahan lain, dengan Mali-G77 dan Valhall menjanjikan peningkatan prestasi yang ketara untuk beban kerja permainan dan pembelajaran mesin. Yang penting, penggunaan kuasa dan kawasan cip dikekalkan pada tahap Bifrost, menjanjikan peranti mudah alih dengan prestasi puncak yang lebih tinggi tanpa meningkatkan penggunaan kuasa, pelesapan haba dan keperluan saiz.



Sumber: 3dnews.ru

Tambah komen