ARM Mali-G77 GPU は 40% 高速です

新しいプロセッサーコアとともに Cortex-A77 ARM は、次世代モバイル シングルチップ システム向けに設計されたグラフィックス プロセッサを発表しました。 Mali-G77、新しいディスプレイ プロセッサと混同しないでください マリD77、ARM Bifrost アーキテクチャから Valhall への移行を示します。

ARM Mali-G77 GPU は 40% 高速です

ARM は、Mali-G77 のグラフィックス パフォーマンスが現行世代の Mali-G40 と比較して 76% 向上していると宣言しています。 これは、技術的なプロセスとアーキテクチャの改善の両方を通じて達成されました。 Mali-G77 は 7 ~ 16 コアを搭載でき (将来的には 1 ~ 32 までの拡張が可能)、それぞれのコアのサイズは G76 とほぼ同じです。 その結果、ハイエンドスマートフォンには同じ数の GPU コアが搭載される可能性があります。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

ゲームでは、グラフィックス ワークロードの種類に応じて、20 ~ 40% のパフォーマンスの向上が期待できます。 人気のマンハッタン GFXBench テストの結果から判断すると、現行世代よりも新しい GPU が大幅に優れているため、ライバルの Qualcomm は Adreno グラフィックス パフォーマンスの大幅な向上について心配せざるを得なくなるでしょう。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

ARM によれば、新しい Mali-G77 アーキテクチャは、それ自体で電力効率またはパフォーマンスが平均 30% 向上します。 第 16 世代の ARM Valhall スカラー アーキテクチャにより、GPU は CU 上で 76 サイクルあたり 1.3 命令を並列実行できます (Bifrost (Mali-G16) では XNUMX 命令)。 その他の革新には、Bifrost との下位互換性を維持しながら、完全にハードウェア駆動の動的命令スケジューリングやまったく新しい命令セットが含まれます。 ARM AFBCXNUMX 圧縮形式とその他の技術革新 (FPXNUMX レンダー ターゲット、レイヤード レンダリング、および頂点シェーダー出力) のサポートも追加されました。


ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

Bifrost CU には 3 つの実行エンジンが含まれており、それぞれの実行エンジンには命令キャッシュ、レジスタ、ワープ コントロール ユニットが含まれていました。 これら 24 つのエンジンに分散することで、32 個の FMA 命令を 32 ビット浮動小数点精度 (FP16) で実行できるようになりました。 Valhall では、各 CU に実行エンジンが 32 つだけあり、クロックあたり 32 個の Warp 命令を処理できる 77 つの計算ユニットに分割され、結果として CU あたり 76 個の FMA FPXNUMX 命令の合計スループットになります。 これらのアーキテクチャ変更のおかげで、Mali-GXNUMX は、Mali-GXNUMX と比較して、並列計算で XNUMX 分の XNUMX 多くの数学的計算を実行できます。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

さらに、これらの各 CU には XNUMX つの新しい数学関数ブロックが含まれています。 新しい変換エンジン (CVT) は、基本的な整数、論理、分岐、および変換命令​​を処理します。 特殊関数ユニット (SFU) は、整数の乗算、除算、平方根、対数、およびその他の複雑な整数関数を高速化します。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

標準 FMA ブロックには、サイクルあたり 16 の FP32 命令、FP32 の場合は 16、または INT64 ドット積の場合は 8 をサポートするいくつかの設定があります。 これらの最適化により、機械学習アプリケーションのパフォーマンスが最大 60% 向上します。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

Mali-G77 のもう 4 つの重要な変更は、テクスチャ エンジンのパフォーマンスが 2 倍になり、以前の 16 つのクロックあたり 32 つのトリリニア テクセルと比較して、クロックあたり XNUMX つのバイリニア テクセルを処理するようになり、より高速な FPXNUMX および FPXNUMX フィルタリングが可能になります。

ARM Mali-G77 GPU は 40% 高速です

ARM Mali-G77 GPU は 40% 高速です

ARM は他にも多くの変更を加えており、Mali-G77 と Valhall はゲームや機械学習のワークロードのパフォーマンスを大幅に向上させることを約束しています。 重要なのは、消費電力とチップ面積が Bifrost レベルに維持され、消費電力、熱放散、サイズ要件を増やすことなく、モバイル デバイスのピーク パフォーマンスの向上が期待できることです。



出所: 3dnews.ru

コメントを追加します