ARM Mali-G77 GPU 速度提升 40%

随着新的处理器核心 Cortex-A77的 ARM 推出了专为下一代移动单芯片系统设计的图形处理器。 Mali-G77,不应与新的显示处理器混淆 马里-D77,标志着从 ARM Bifrost 架构到 Valhall 的过渡。

ARM Mali-G77 GPU 速度提升 40%

ARM 宣称 Mali-G77 的图形性能比当前一代 Mali-G40 显着提高了 76%。 这是通过技术流程和架构改进实现的。 Mali-G77可以有7到16个核心(未来可以从1个扩展到32个),并且每个核心的大小几乎与G76相同。 因此,高端智能手机可能会配备相同数量的 GPU 核心。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

在游戏中,您可以预期性能提升 20% 到 40%,具体取决于图形工作负载的类型。 从流行的Manhattan GFXBench测试结果来看,新GPU相对于当前一代的显着优势将迫使竞争对手高通担心Adreno图形性能的显着提升。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

ARM 表示,新的 Mali-G77 架构本身的能效或性能平均提高了 30%。 第二代 ARM Valhall 标量架构允许 GPU 每个周期在 CU 上并行执行 16 条指令,而 Bifrost (Mali-G76) 中只有 1.3 条指令。 其他创新包括完全硬件驱动的动态指令调度和全新的指令集,同时保持与 Bifrost 的向后兼容性。 还添加了对 ARM AFBC16 压缩格式和其他创新(FPXNUMX 渲染目标、分层渲染和顶点着色器输出)的支持。


ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

Bifrost CU 包含 3 个执行引擎,每个引擎都包含一个指令缓存、一个寄存器和一个 Warp 控制单元。 这三个引擎之间的分布允许以 24 位浮点精度 (FP32) 执行 32 个 FMA 指令。 在 Valhall 中,每个 CU 只有一个执行引擎,分为两个计算单元,每个时钟能够处理 16 个 Warp 指令,从而每个 CU 的总吞吐量为 32 个 FMA FP32 指令。 由于这些架构上的变化,与 Mali-G77 相比,Mali-G76 在并行计算中可以多执行三分之一的数学计算。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

此外,每个 CU 都包含两个新的数学功能块。 新的转换引擎 (CVT) 处理基本的整数、逻辑、分支和转换指令。 特殊功能单元 (SFU) 可加速整数乘法、除法、平方根、对数和其他复杂整数函数。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

标准 FMA 模块有多种设置,支持每周期 16 条 FP32 指令、FP32 为 16 条指令或 INT64 点积为 8 条指令。 这些优化可以使机器学习应用程序的性能提高高达 60%。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

Mali-G77 的另一个关键变化是纹理引擎的性能翻倍,与之前的每个时钟处理 4 个三线性纹理像素相比,现在每个时钟处理 2 个双线性纹理像素,从而实现更快的 FP16 和 FP32 过滤。

ARM Mali-G77 GPU 速度提升 40%

ARM Mali-G77 GPU 速度提升 40%

ARM 还做出了许多其他改变,Mali-G77 和 Valhall 承诺显着提高游戏和机器学习工作负载的性能。 重要的是,功耗和芯片面积保持在 Bifrost 水平,从而保证移动设备在不增加功耗、散热和尺寸要求的情况下具有更高的峰值性能。



来源: 3dnews.ru

添加评论