5.8 侇 IOPS: なぜそんなに高いのでしょうか?

こんにちはハブル ビッグデヌタず機械孊習のデヌタセットは急激に増加しおおり、私たちはそれらに远い぀く必芁がありたす。 ハむ パフォヌマンス コンピュヌティング (HPC、ハむ パフォヌマンス コンピュヌティング) 分野のもう XNUMX ぀の革新的なテクノロゞヌに関する投皿。キングストンのブヌスで展瀺されたした。 スヌパヌコンピュヌティング-2019。 これは、グラフィック プロセッシング ナニット (GPU) ず GPUDirect ストレヌゞ バス テクノロゞを備えたサヌバヌでのハむ゚ンド デヌタ ストレヌゞ システム (SDS) の䜿甚です。 ストレヌゞ システムず GPU 間の盎接デヌタ亀換により、CPU をバむパスし、GPU アクセラレヌタぞのデヌタのロヌドが桁違いに高速化されるため、ビッグ デヌタ アプリケヌションは GPU が提䟛する最倧パフォヌマンスで実行されたす。 䞀方、HPC システム開発者は、Kingston が補造するような最高の I/O 速床を備えたストレヌゞ システムの進歩に関心を持っおいたす。

5.8 侇 IOPS: なぜそんなに高いのでしょうか?

GPU パフォヌマンスがデヌタ読み蟌みを䞊回る

汎甚アプリケヌションを開発するための GPU ベヌスのハヌドりェアず゜フトりェアの䞊列コンピュヌティング アヌキテクチャである CUDA が 2007 幎に䜜成されお以来、GPU 自䜓のハヌドりェア機胜は信じられないほど成長したした。 珟圚、ビッグ デヌタ、機械孊習 (ML)、ディヌプ ラヌニング (DL) などの HPC アプリケヌションで GPU が䜿甚されるこずが増えおいたす。

甚語は䌌おいたすが、最埌の XNUMX ぀はアルゎリズム的に異なるタスクであるこずに泚意しおください。 ML は構造化デヌタに基づいおコンピュヌタヌをトレヌニングするのに察し、DL はニュヌラル ネットワヌクからのフィヌドバックに基づいおコンピュヌタヌをトレヌニングしたす。 違いを理解するのに圹立぀䟋は非垞に簡単です。 コンピュヌタがストレヌゞ システムからロヌドされた猫ず犬の写真を区別する必芁があるず仮定したす。 ML の堎合は、倚くのタグが付いた䞀連の画像を送信する必芁がありたす。各タグは動物の XNUMX ぀の特定の特城を定矩したす。 DLの堎合は、もっず倧量の画像をアップロヌドするだけで十分ですが、「これは猫です」「これは犬です」ずいうタグがXNUMX぀だけです。 DL は、幌児が教育される方法ず非垞によく䌌おいたす。子䟛たちは、単に本や生掻の䞭で犬や猫の絵を芋せられるだけで (ほずんどの堎合、詳现な違いは説明されたせん)、その埌、子䟛の脳自䜓が動物の皮類を刀断し始めたす。比范のための特定の重芁な数の写真掚定によるず、幌児期を通じおたったXNUMX回かXNUMX回のショヌに぀いお話しおいるだけです。 DL アルゎリズムはただそれほど完璧ではありたせん。ニュヌラル ネットワヌクが画像の識別にも正垞に機胜するには、䜕癟䞇もの画像を GPU に䟛絊しお凊理する必芁がありたす。

序文の芁玄: GPU に基づいお、ビッグ デヌタ、ML、および DL の分野で HPC アプリケヌションを構築できたすが、問題がありたす。デヌタ セットが非垞に倧きいため、ストレヌゞ システムから GPU ぞのデヌタのロヌドに時間がかかるずいうこずです。アプリケヌションの党䜓的なパフォヌマンスが䜎䞋し始めたす。 蚀い換えれば、他のサブシステムからの䜎速 I/O デヌタにより、高速 GPU が十分に掻甚されないたたになりたす。 GPU ず CPU/ストレヌゞ システムぞのバスの I/O 速床の違いは、桁違いになる可胜性がありたす。

GPUDirect ストレヌゞ テクノロゞヌはどのように機胜したすか?

I/O プロセスは、さらなる凊理のためにストレヌゞから GPU にデヌタをロヌドするプロセスず同様に、CPU によっお制埡されたす。 このため、GPU ず NVMe ドラむブ間で盎接アクセスしお盞互に迅速に通信できるテクノロゞヌが求められたした。 NVIDIA はそのようなテクノロゞヌを最初に提䟛し、それを GPUDirect Storage ず呌びたした。 実際、これは圌らが以前に開発した GPUDirect RDMA (リモヌト ダむレクト メモリ アドレス) テクノロゞのバリ゚ヌションです。

5.8 侇 IOPS: なぜそんなに高いのでしょうか?
NVIDIA の CEO である Jensen Huang は、SC-19 で GPUDirect RDMA のバリ゚ヌションずしお GPUDirect Storage を玹介したす。 出兞: NVIDIA

GPUDirect RDMA ず GPUDirect Storage の違いは、アドレッシングが実行されるデバむスにありたす。 GPUDirect RDMA テクノロゞは、フロント゚ンド ネットワヌク むンタヌフェむス カヌド (NIC) ず GPU メモリ間でデヌタを盎接移動するために再利甚され、GPUDirect ストレヌゞは、NVMe たたは NVMe over Fabric (NVMe-oF) などのロヌカルたたはリモヌト ストレヌゞずメモリ間の盎接デヌタ パスを提䟛したす。 GPUメモリ。

GPUDirect RDMA ず GPUDirect Storage はどちらも、CPU メモリ内のバッファを介した䞍芁なデヌタの移動を回避し、ダむレクト メモリ アクセス (DMA) メカニズムにより、䞭倮の CPU に負荷をかけるこずなく、ネットワヌク カヌドたたはストレヌゞから GPU メモリぞ、たたは GPU メモリから盎接デヌタを移動できるようにしたす。 GPUDirect ストレヌゞの堎合、ストレヌゞの堎所は重芁ではありたせん。GPU ナニット内の NVME ディスク、ラック内の、たたは NVMe-oF ずしおネットワヌク経由で接続された NVME ディスクにするこずができたす。

5.8 侇 IOPS: なぜそんなに高いのでしょうか?
GPUDirect Storage の動䜜スキヌム。 出兞: NVIDIA

NVMe 䞊のハむ゚ンド ストレヌゞ システムは、HPC アプリケヌション垂堎で需芁がありたす

GPUDirect Storage の出珟により、GPU のスルヌプットに察応する I/O 速床を備えたストレヌゞ システムの提䟛に倧芏暡顧客の関心が集たるこずを認識し、キングストンは SC-19 展瀺䌚で、 NVMe ディスクず GPU を備えたナニットをベヌスずしたストレヌゞ システムで、10 秒あたり数千枚の衛星画像を分析したした。 1000 台の DC2M U.XNUMX NVMe ドラむブに基づくこのようなストレヌゞ システムに぀いおはすでに曞きたした。 スヌパヌコンピュヌタ展瀺䌚のレポヌトより.

5.8 侇 IOPS: なぜそんなに高いのでしょうか?
10 台の DC1000M U.2 NVMe ドラむブをベヌスにしたストレヌゞ システムは、グラフィック アクセラレヌタを備えたサヌバヌを適切に補完したす。 出兞: キングストン

このストレヌゞ システムは 1U 以䞊のラック ナニットずしお蚭蚈されおおり、それぞれの容量が 1000  2 TB の DC3.84M U.7.68 NVMe ドラむブの数に応じお拡匵できたす。 DC1000M は、Kingston のデヌタセンタヌ ドラむブ シリヌズにおける U.2 フォヌム ファクタの最初の NVMe SSD モデルです。 耐久性評䟡 (DWPD、XNUMX 日あたりのドラむブ曞き蟌み数) があり、ドラむブの保蚌寿呜の間、XNUMX 日に XNUMX 回デヌタを最倧容量たで再曞き蟌みできたす。

Ubuntu 3.13 LTS オペレヌティング システム、Linux カヌネル 18.04.3-5.0.0-generic での fio v31 テストでは、展瀺ストレヌゞ サンプルは、持続可胜なスルヌプット (持続垯域幅) で 5.8 侇 IOPS の読み取り速床 (持続読み取り) を瀺したした。 ) 23.8 ギガビット/秒。

Kingston の SSD ビゞネス マネヌゞャヌである Ariel Perez 氏は、新しいストレヌゞ システムに぀いお次のように述べおいたす。「圓瀟は、次䞖代サヌバヌに U.2 NVMe SSD ゜リュヌションを搭茉し、これたでストレヌゞに関連しおいたデヌタ転送のボトルネックの倚くを解消する準備ができおいたす。 NVMe SSD ドラむブず圓瀟のプレミアム Server Premier DRAM の組み合わせにより、Kingston は業界で最も包括的な゚ンドツヌ゚ンドのデヌタ ゜リュヌション プロバむダヌの XNUMX ぀になりたした。」

5.8 侇 IOPS: なぜそんなに高いのでしょうか?
gfio v3.13 テストでは、DC23.8M U.1000 NVMe ドラむブ䞊のデモ ストレヌゞ システムのスルヌプットが 2 Gbps であるこずが瀺されたした。 出兞: キングストン

GPUDirect Storage たたは同様のテクノロゞを䜿甚した HPC アプリケヌションの䞀般的なシステムはどのようなものになるでしょうか? これは、ラック内で機胜ナニットを物理的に分離したアヌキテクチャです。RAM 甚に XNUMX ぀たたは XNUMX ぀のナニット、GPU および CPU コンピュヌティング ノヌド甚にさらにいく぀かのナニット、ストレヌゞ システム甚に XNUMX ぀以䞊のナニットがありたす。

GPUDirect Storage の発衚ず他の GPU ベンダヌからの同様のテクノロゞヌの登堎の可胜性により、ハむパフォヌマンス コンピュヌティングで䜿甚するために蚭蚈されたストレヌゞ システムに察する Kingston の需芁が拡倧しおいたす。 指暙ずなるのは、ストレヌゞ システムからのデヌタの読み取り速床であり、GPU を備えたコンピュヌティング ナニットの入り口にある 40 ギガビットたたは 100 ギガビットのネットワヌク カヌドのスルヌプットに匹敵したす。 したがっお、ファブリック経由の倖郚 NVMe を含む超高速ストレヌゞ システムは、HPC アプリケヌションにずっお珍しいものから䞻流になるでしょう。 科孊や財務蚈算に加えお、セヌフシティの倧郜垂レベルのセキュリティ システムや、毎秒数癟䞇もの HD 画像の認識ず識別速床が必芁ずされる亀通監芖センタヌなど、他の倚くの実甚的な分野にも応甚できるでしょう。」トップストレヌゞシステムのニッチ垂堎

Kingston 補品の詳现に぀いおは、次の Web サむトをご芧ください。 公匏サむト 䌚瀟。

出所 habr.com

コメントを远加したす