GPU ARM Mali-G77 เร็วขึ้น 40%

พร้อมด้วยคอร์โปรเซสเซอร์ใหม่ Cortex-A77 ARM เปิดตัวโปรเซสเซอร์กราฟิกที่ออกแบบมาสำหรับระบบชิปเดี่ยวมือถือยุคหน้า Mali-G77 ซึ่งไม่ควรสับสนกับโปรเซสเซอร์แสดงผลรุ่นใหม่ มะลิ D77ถือเป็นการเปลี่ยนผ่านจากสถาปัตยกรรม ARM Bifrost มาเป็น Valhall

GPU ARM Mali-G77 เร็วขึ้น 40%

ARM ประกาศประสิทธิภาพกราฟิกที่เพิ่มขึ้นอย่างมากของ Mali-G77 - 40% เมื่อเทียบกับ Mali-G76 รุ่นปัจจุบัน ซึ่งบรรลุผลสำเร็จทั้งผ่านกระบวนการทางเทคนิคและการปรับปรุงสถาปัตยกรรม Mali-G77 สามารถมีได้ตั้งแต่ 7 ถึง 16 คอร์ (สามารถปรับขนาดได้ตั้งแต่ 1 ถึง 32 คอร์ในอนาคต) และแต่ละตัวมีขนาดเกือบเท่ากับ G76 ด้วยเหตุนี้สมาร์ทโฟนระดับไฮเอนด์จึงมีแนวโน้มว่าจะมีแกน GPU จำนวนเท่ากัน

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

ในเกม คุณสามารถคาดหวังการปรับปรุงประสิทธิภาพได้ระหว่าง 20 ถึง 40% ขึ้นอยู่กับประเภทของงานกราฟิก เมื่อพิจารณาจากผลการทดสอบ Manhattan GFXBench ที่ได้รับความนิยม ความเหนือกว่าอย่างมีนัยสำคัญของ GPU ใหม่เหนือรุ่นปัจจุบันจะบังคับให้คู่แข่ง Qualcomm กังวลเกี่ยวกับการปรับปรุงประสิทธิภาพกราฟิก Adreno อย่างมีนัยสำคัญ

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

ด้วยตัวมันเอง สถาปัตยกรรม Mali-G77 ใหม่ให้ประสิทธิภาพการใช้พลังงานหรือประสิทธิภาพที่ดีขึ้นโดยเฉลี่ย 30 เปอร์เซ็นต์ ARM กล่าว สถาปัตยกรรมสเกลาร์ ARM Valhall รุ่นที่สองช่วยให้ GPU สามารถดำเนินการ 16 คำสั่งต่อรอบในแบบคู่ขนานบน CU เทียบกับแปดคำสั่งใน Bifrost (Mali-G76) นวัตกรรมอื่นๆ ได้แก่ การตั้งเวลาคำสั่งแบบไดนามิกที่ขับเคลื่อนด้วยฮาร์ดแวร์เต็มรูปแบบ และชุดคำสั่งใหม่ทั้งหมด ในขณะที่ยังคงความเข้ากันได้แบบย้อนหลังกับ Bifrost เพิ่มการรองรับรูปแบบการบีบอัด ARM AFBC1.3 และนวัตกรรมอื่นๆ (เป้าหมายการเรนเดอร์ FP16 การเรนเดอร์แบบเลเยอร์ และเอาท์พุต vertex shader)


GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

Bifrost CU มีเอ็นจิ้นการดำเนินการ 3 ตัว ซึ่งแต่ละกลไกมีแคชคำสั่ง รีจิสเตอร์ และหน่วยควบคุม Warp การกระจายข้ามเอ็นจิ้นทั้งสามนี้อนุญาตให้ดำเนินการคำสั่ง FMA 24 คำสั่งที่ความแม่นยำจุดลอยตัว 32 บิต (FP32) ใน Valhall CU แต่ละตัวมีกลไกดำเนินการเพียงตัวเดียว ซึ่งแบ่งระหว่างหน่วยประมวลผล 16 ยูนิตที่สามารถประมวลผลคำสั่ง Warp 32 คำสั่งต่อนาฬิกา ส่งผลให้มีทรูพุตรวม 32 คำสั่ง FMA FP77 ต่อ CU ด้วยการเปลี่ยนแปลงทางสถาปัตยกรรมเหล่านี้ Mali-G76 จึงสามารถคำนวณทางคณิตศาสตร์ได้มากขึ้นหนึ่งในสามในการคำนวณแบบคู่ขนาน เมื่อเทียบกับ Mali-GXNUMX

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

นอกจากนี้ CU แต่ละตัวยังมีบล็อกฟังก์ชันทางคณิตศาสตร์ใหม่สองบล็อก เอ็นจิ้นการแปลงใหม่ (CVT) จัดการกับจำนวนเต็มพื้นฐาน ลอจิคัล สาขา และคำสั่งการแปลง หน่วยฟังก์ชันพิเศษ (SFU) เร่งความเร็วในการคูณจำนวนเต็ม การหาร รากที่สอง ลอการิทึม และฟังก์ชันจำนวนเต็มเชิงซ้อนอื่นๆ

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

บล็อก FMA มาตรฐานมีการตั้งค่าหลายอย่างที่รองรับ 16 คำสั่ง FP32 ต่อรอบ, 32 คำสั่งสำหรับ FP16 หรือ 64 สำหรับ INT8 Dot Product การเพิ่มประสิทธิภาพเหล่านี้สามารถปรับปรุงประสิทธิภาพได้สูงสุดถึง 60% ในแอปพลิเคชันการเรียนรู้ของเครื่อง

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

การเปลี่ยนแปลงที่สำคัญอีกประการหนึ่งใน Mali-G77 คือการเพิ่มประสิทธิภาพของเอ็นจิ้นพื้นผิวเป็นสองเท่า ซึ่งขณะนี้ประมวลผล 4 Bilinear Texel ต่อนาฬิกา เมื่อเทียบกับ 2 Texel ก่อนหน้า 16 Trilinear ต่อนาฬิกา ทำให้สามารถกรอง FP32 และ FPXNUMX ได้เร็วขึ้น

GPU ARM Mali-G77 เร็วขึ้น 40%

GPU ARM Mali-G77 เร็วขึ้น 40%

ARM ได้ทำการเปลี่ยนแปลงอื่นๆ มากมาย โดย Mali-G77 และ Valhall สัญญาว่าจะปรับปรุงประสิทธิภาพที่สำคัญสำหรับเวิร์กโหลดเกมและการเรียนรู้ของเครื่อง ที่สำคัญ การใช้พลังงานและพื้นที่ชิปจะยังคงอยู่ที่ระดับ Bifrost ซึ่งหมายความว่าอุปกรณ์เคลื่อนที่จะมีประสิทธิภาพสูงสุดที่สูงขึ้น โดยไม่ต้องเพิ่มการใช้พลังงาน การกระจายความร้อน และข้อกำหนดด้านขนาด



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น