A nyolc éve alapított brit Graphcore cég már ismertté vált a nagy teljesítményű AI-gyorsítók kibocsátásáról, amelyeket a Microsoft és a Dell szívesen fogadott. A Graphcore által fejlesztett gyorsítók kezdetben az AI-t célozzák, ami az AI problémák megoldására adaptált NVIDIA GPU-król nem mondható el. A
Az Ampere architektúrára épülő NVIDIA A100 megoldás 54 milliárd tranzisztort tartalmaz. Az új, 7 nm-es Graphcore Colossus MK2 processzor (IPU GC200) chipjén 59,4 milliárd tranzisztor található. Így a világ legösszetettebb chipjének koronája (kivéve az egylemezes szörnyet
Minden GC200 chip 1472 független processzormagot hordoz „csempék” készlet formájában, és 8832 számítási szál párhuzamos végrehajtására képes. A cég korábbi megoldása egy 1216 magból és 7296 szálból álló gyorsító volt. Minden „csempének” van saját memóriablokkja. Az új fejlesztés összesen 900 MB belső memóriával rendelkezik, míg a korábbi processzorban mindössze 300 MB memória.
Ez a megoldás a Graphcore gyorsítók hatalmas teljes áteresztőképességét biztosítja. Így egy polcos számítógép négy Colossus MK2 gyorsítóval ellátott szabványos rackhez egy petaflop teljesítményt nyújt. 64 ezer IPU közös munkája 16 exaflop teljesítményét biztosítja. A Graphcore platform méretezését egyszerűen a blokkok automatikus konfigurációval történő növelésével hajtják végre, ami jelentősen bővíti a vállalat gyorsítóinak felhasználói körét.
Korábban Microsoft
Forrás:
Forrás: 3dnews.ru