ARM Mali-G77 GPU 速度提升 40%

隨著新的處理器核心 的Cortex-A77 ARM 推出了專為下一代行動單晶片系統設計的圖形處理器。 Mali-G77,不應與新的顯示處理器混淆 馬里-D77,標誌著從 ARM Bifrost 架構到 Valhall 的過渡。

ARM Mali-G77 GPU 速度提升 40%

ARM 宣稱 Mali-G77 的圖形性能比當前一代 Mali-G40 顯著提高了 76%。 這是透過技術流程和架構改進來實現的。 Mali-G77可以有7到16個核心(將來可以從1個擴展到32個),並且每個核心的大小幾乎與G76相同。 因此,高階智慧型手機可能會配備相同數量的 GPU 核心。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

在遊戲中,您可以預期效能提升 20% 到 40%,具體取決於圖形工作負載的類型。 從流行的Manhattan GFXBench測試結果來看,新GPU相對於當前世代的顯著優勢將迫使競爭對手高通擔心Adreno圖形性能的顯著提升。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

ARM 表示,新的 Mali-G77 架構本身的能源效率或效能平均提高了 30%。 第二代 ARM Valhall 標量架構允許 GPU 每個週期在 CU 上並行執行 16 條指令,而 Bifrost (Mali-G76) 中只有 1.3 條指令。 其他創新包括完全硬體驅動的動態指令調度和全新的指令集,同時保持與 Bifrost 的向後相容性。 還新增了對 ARM AFBC16 壓縮格式和其他創新(FPXNUMX 渲染目標、分層渲染和頂點著色器輸出)的支援。


ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

Bifrost CU 包含 3 個執行引擎,每個引擎都包含一個指令快取、一個暫存器和一個 Warp 控制單元。 這三個引擎之間的分佈允許以 24 位元浮點精度 (FP32) 執行 32 個 FMA 指令。 在 Valhall 中,每個 CU 只有一個執行引擎,分成兩個計算單元,每個時脈能夠處理 16 個 Warp 指令,從而每個 CU 的總吞吐量為 32 個 FMA FP32 指令。 由於這些架構上的變化,與 Mali-G77 相比,Mali-G76 在平行計算中可以多執行三分之一的數學計算。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

此外,每個 CU 都包含兩個新的數學功能塊。 新的轉換引擎 (CVT) 處理基本的整數、邏輯、分支和轉換指令。 特殊功能單元 (SFU) 可加速整數乘法、除法、平方根、對數和其他複雜整數函數。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

標準 FMA 模組有多種設置,支援每週期 16 條 FP32 指令、FP32 為 16 條指令或 INT64 點積為 8 條指令。 這些優化可以使機器學習應用程式的效能提高高達 60%。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

Mali-G77 的另一個關鍵變化是紋理引擎的性能翻倍,與之前的每個時鐘處理4 個三線性紋理像素相比,現在每個時鐘處理2 個雙線性紋理像素,從而實現更快的FP16 和FP32 過濾。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

ARM 也做出了許多其他改變,Mali-G77 和 Valhall 承諾顯著提高遊戲和機器學習工作負載的效能。 重要的是,功耗和晶片面積保持在 Bifrost 水平,確保行動裝置在不增加功耗、散熱和尺寸要求的情況下具有更高的峰值效能。



來源: 3dnews.ru

添加評論