XNUMX 年前に設立された英国の企業 Graphcore は、強力な AI アクセラレータのリリースですでに名を馳せており、Microsoft と Dell に温かく受け入れられました。 Graphcore が開発したアクセラレータは当初 AI を目的としていましたが、AI の問題の解決に適応した NVIDIA GPU については言えませんでした。 あ
Ampere アーキテクチャに基づく NVIDIA A100 ソリューションには、54 億個のトランジスタが含まれています。 新しい 7nm Graphcore Colossus MK2 プロセッサ (IPU GC200) には、チップ上に 59,4 億個のトランジスタが搭載されています。 したがって、世界で最も複雑なチップの冠(単板モンスターを除く)
各 GC200 チップは、「タイル」のセットの形式で 1472 個の独立したプロセッサ コアを搭載しており、8832 個の計算スレッドを並列実行できます。 同社の以前のソリューションは、1216 コアと 7296 スレッドを備えたアクセラレータでした。 各「タイル」には独自のメモリ ブロックがあります。 新しい開発品には合計 900 MB の内部メモリが搭載されていますが、以前のプロセッサのメモリは 300 MB しかありませんでした。
このようなソリューションは、Graphcore アクセラレータの膨大な合計スループットを提供します。 したがって、2 つの Colossus MK64 アクセラレータを備えた標準ラックの 16 台のシェルフ コンピュータのパフォーマンスは XNUMX ペタフロップスになります。 XNUMX 個の IPU を連携させると、XNUMX エクサフロップスのパフォーマンスが得られます。 Graphcore プラットフォームのスケーリングは、自動構成でブロックを増やすだけで実行されるため、同社のアクセラレータのユーザーの輪が大幅に拡大します。
以前はマイクロソフト
出所:
出所: 3dnews.ru