状況: 仮想 GPU はハードウェア ソリューションと比べてパフォーマンスが劣っていません。

XNUMX 月、スタンフォード大学はハイパフォーマンス コンピューティング (HPC) に関するカンファレンスを主催しました。 VMware の担当者は、GPU を使用する場合、修正された ESXi ハイパーバイザーをベースにしたシステムは速度の点でベア メタル ソリューションに劣ることはないと述べています。

これを実現したテクノロジーについてお話します。

状況: 仮想 GPU はハードウェア ソリューションと比べてパフォーマンスが劣っていません。
/ 写真 ヴィクトルグリガス のCC BY-SA

パフォーマンスの問題

アナリストによると、データセンターのワークロードの約 70% 仮想化された。 ただし、残りの 30% は依然としてハイパーバイザーなしのベアメタル上で実行されます。 この 30% は主に、ニューラル ネットワークのトレーニングや GPU の使用に関連するアプリケーションなど、高負荷のアプリケーションで構成されています。

専門家は、中間抽象化層としてのハイパーバイザーがシステム全体のパフォーマンスに影響を与える可能性があるという事実によって、この傾向を説明しています。 XNUMX年前の研究では データを見つけることができます 作業速度を10%下げることについて。 したがって、企業やデータセンター運営者は、HPC ワークロードを仮想環境に移行することを急いでいません。

しかし、仮想化テクノロジーは発展し、改善されています。 VMware は XNUMX か月前のカンファレンスで、ESXi ハイパーバイザーは GPU のパフォーマンスに悪影響を及ぼさないと述べました。 コンピューティング速度は XNUMX% 低下する可能性があり、これはベアメタルに匹敵します。

これはどう動かすのですか

GPU を備えた HPC システムのパフォーマンスを向上させるために、VMware はハイパーバイザーに多くの変更を加えました。 特に、vMotion 機能が削除されました。 これは負荷分散に必要であり、通常はサーバーまたは GPU 間で仮想マシン (VM) を転送します。 vMotion を無効にすると、各 VM に特定の GPU が割り当てられるようになりました。 これにより、データ交換時のコストを削減できました。

システムのもう XNUMX つの重要なコンポーネント テクノロジーです ダイレクトパス I/O。 これにより、CUDA 並列コンピューティング ドライバーがハイパーバイザーをバイパスして、仮想マシンと直接対話できるようになります。 XNUMX つの GPU で複数の VM を同時に実行する必要がある場合は、GRID vGPU ソリューションが使用されます。 カードのメモリをいくつかのセグメントに分割します (ただし、計算サイクルは分割されません)。

この場合の XNUMX 台の仮想マシンの動作図は次のようになります。

状況: 仮想 GPU はハードウェア ソリューションと比べてパフォーマンスが劣っていません。

実績と見通し

会社 実施されたテスト に基づいて言語モデルをトレーニングすることによるハイパーバイザー TensorFlow。 パフォーマンスの「ダメージ」は、ベアメタルと比較してわずか 3 ~ 4% でした。 その代わりに、システムは現在の負荷に応じてオンデマンドでリソースを配布できるようになりました。

IT巨人も 実施されたテスト コンテナ付き。 同社のエンジニアは、画像を認識できるようにニューラル ネットワークをトレーニングしました。 同時に、17 つの GPU のリソースが XNUMX つのコンテナ VM に分散されました。 その結果、個々のマシンのパフォーマンスは XNUMX% 低下しました (GPU リソースに完全にアクセスできる単一の VM と比較)。 ただし、XNUMX秒あたりに処理される画像の数は、 増加しました XNUMX回。 このようなシステムが期待されています 見つけるでしょう データ分析とコンピューターモデリングのアプリケーション。

VMware が直面する可能性のある潜在的な問題として、専門家は次のように述べています。 発する かなり狭い対象者です。 少数の企業が依然として高性能システムを使用しています。 スタティスタではありますが 祝う2021 年までに、世界のデータセンターのワークロードの 94% が仮想化される予定です。 による 予測 アナリストらによると、HPC 市場の価値は 32 年から 45 年の間に 2017 億ドルから 2022 億ドルに成長すると予想されています。

状況: 仮想 GPU はハードウェア ソリューションと比べてパフォーマンスが劣っていません。
/ 写真 グローバルアクセスポイント PD

同様のソリューション

市場には、AMD や Intel などの大手 IT 企業によって開発された類似製品がいくつかあります。

GPU仮想化の最初の企業 提供 SR-IOV (シングルルート入出力仮想化) に基づくアプローチ。 このテクノロジーにより、VM はシステムのハードウェア機能の一部にアクセスできるようになります。 このソリューションを使用すると、16 人のユーザー間で GPU を共有し、仮想化システムの同等のパフォーマンスを実現できます。

第二のIT巨人については、 テクノロジーベースの Citrix XenServer 7 ハイパーバイザー上では、標準の GPU ドライバーと仮想マシンの機能が結合されており、仮想マシンは数百のユーザーのデバイス上で 3D アプリケーションとデスクトップを表示できるようになります。

テクノロジーの未来

仮想 GPU 開発者 賭ける AI システムの実装と、ビジネス テクノロジー市場における高性能ソリューションの人気の高まりについて説明します。 彼らは、大量のデータを処理する必要性により、vGPU の需要が高まると期待しています。

現在のメーカー 方法を探しています CPU と GPU の機能を XNUMX つのコアに結合して、グラフィックスに関連する問題の解決、数学的計算、論理演算、およびデータ処理の実行を高速化します。 将来的にこのようなコアが市場に登場すると、リソースの仮想化と、仮想環境とクラウド環境のワークロード間でのリソースの分散へのアプローチが変化するでしょう。

当社の企業ブログのトピックに関する読み物:

Telegram チャンネルからのいくつかの投稿:

出所: habr.com

コメントを追加します