พร้อมด้วยคอร์โปรเซสเซอร์ใหม่
ARM ประกาศประสิทธิภาพกราฟิกที่เพิ่มขึ้นอย่างมากของ Mali-G77 - 40% เมื่อเทียบกับ Mali-G76 รุ่นปัจจุบัน ซึ่งบรรลุผลสำเร็จทั้งผ่านกระบวนการทางเทคนิคและการปรับปรุงสถาปัตยกรรม Mali-G77 สามารถมีได้ตั้งแต่ 7 ถึง 16 คอร์ (สามารถปรับขนาดได้ตั้งแต่ 1 ถึง 32 คอร์ในอนาคต) และแต่ละตัวมีขนาดเกือบเท่ากับ G76 ด้วยเหตุนี้สมาร์ทโฟนระดับไฮเอนด์จึงมีแนวโน้มว่าจะมีแกน GPU จำนวนเท่ากัน
ในเกม คุณสามารถคาดหวังการปรับปรุงประสิทธิภาพได้ระหว่าง 20 ถึง 40% ขึ้นอยู่กับประเภทของงานกราฟิก เมื่อพิจารณาจากผลการทดสอบ Manhattan GFXBench ที่ได้รับความนิยม ความเหนือกว่าอย่างมีนัยสำคัญของ GPU ใหม่เหนือรุ่นปัจจุบันจะบังคับให้คู่แข่ง Qualcomm กังวลเกี่ยวกับการปรับปรุงประสิทธิภาพกราฟิก Adreno อย่างมีนัยสำคัญ
ด้วยตัวมันเอง สถาปัตยกรรม Mali-G77 ใหม่ให้ประสิทธิภาพการใช้พลังงานหรือประสิทธิภาพที่ดีขึ้นโดยเฉลี่ย 30 เปอร์เซ็นต์ ARM กล่าว สถาปัตยกรรมสเกลาร์ ARM Valhall รุ่นที่สองช่วยให้ GPU สามารถดำเนินการ 16 คำสั่งต่อรอบในแบบคู่ขนานบน CU เทียบกับแปดคำสั่งใน Bifrost (Mali-G76) นวัตกรรมอื่นๆ ได้แก่ การตั้งเวลาคำสั่งแบบไดนามิกที่ขับเคลื่อนด้วยฮาร์ดแวร์เต็มรูปแบบ และชุดคำสั่งใหม่ทั้งหมด ในขณะที่ยังคงความเข้ากันได้แบบย้อนหลังกับ Bifrost เพิ่มการรองรับรูปแบบการบีบอัด ARM AFBC1.3 และนวัตกรรมอื่นๆ (เป้าหมายการเรนเดอร์ FP16 การเรนเดอร์แบบเลเยอร์ และเอาท์พุต vertex shader)
Bifrost CU มีเอ็นจิ้นการดำเนินการ 3 ตัว ซึ่งแต่ละกลไกมีแคชคำสั่ง รีจิสเตอร์ และหน่วยควบคุม Warp การกระจายข้ามเอ็นจิ้นทั้งสามนี้อนุญาตให้ดำเนินการคำสั่ง FMA 24 คำสั่งที่ความแม่นยำจุดลอยตัว 32 บิต (FP32) ใน Valhall CU แต่ละตัวมีกลไกดำเนินการเพียงตัวเดียว ซึ่งแบ่งระหว่างหน่วยประมวลผล 16 ยูนิตที่สามารถประมวลผลคำสั่ง Warp 32 คำสั่งต่อนาฬิกา ส่งผลให้มีทรูพุตรวม 32 คำสั่ง FMA FP77 ต่อ CU ด้วยการเปลี่ยนแปลงทางสถาปัตยกรรมเหล่านี้ Mali-G76 จึงสามารถคำนวณทางคณิตศาสตร์ได้มากขึ้นหนึ่งในสามในการคำนวณแบบคู่ขนาน เมื่อเทียบกับ Mali-GXNUMX
นอกจากนี้ CU แต่ละตัวยังมีบล็อกฟังก์ชันทางคณิตศาสตร์ใหม่สองบล็อก เอ็นจิ้นการแปลงใหม่ (CVT) จัดการกับจำนวนเต็มพื้นฐาน ลอจิคัล สาขา และคำสั่งการแปลง หน่วยฟังก์ชันพิเศษ (SFU) เร่งความเร็วในการคูณจำนวนเต็ม การหาร รากที่สอง ลอการิทึม และฟังก์ชันจำนวนเต็มเชิงซ้อนอื่นๆ
บล็อก FMA มาตรฐานมีการตั้งค่าหลายอย่างที่รองรับ 16 คำสั่ง FP32 ต่อรอบ, 32 คำสั่งสำหรับ FP16 หรือ 64 สำหรับ INT8 Dot Product การเพิ่มประสิทธิภาพเหล่านี้สามารถปรับปรุงประสิทธิภาพได้สูงสุดถึง 60% ในแอปพลิเคชันการเรียนรู้ของเครื่อง
การเปลี่ยนแปลงที่สำคัญอีกประการหนึ่งใน Mali-G77 คือการเพิ่มประสิทธิภาพของเอ็นจิ้นพื้นผิวเป็นสองเท่า ซึ่งขณะนี้ประมวลผล 4 Bilinear Texel ต่อนาฬิกา เมื่อเทียบกับ 2 Texel ก่อนหน้า 16 Trilinear ต่อนาฬิกา ทำให้สามารถกรอง FP32 และ FPXNUMX ได้เร็วขึ้น
ARM ได้ทำการเปลี่ยนแปลงอื่นๆ มากมาย โดย Mali-G77 และ Valhall สัญญาว่าจะปรับปรุงประสิทธิภาพที่สำคัญสำหรับเวิร์กโหลดเกมและการเรียนรู้ของเครื่อง ที่สำคัญ การใช้พลังงานและพื้นที่ชิปจะยังคงอยู่ที่ระดับ Bifrost ซึ่งหมายความว่าอุปกรณ์เคลื่อนที่จะมีประสิทธิภาพสูงสุดที่สูงขึ้น โดยไม่ต้องเพิ่มการใช้พลังงาน การกระจายความร้อน และข้อกำหนดด้านขนาด
ที่มา: 3dnews.ru