Das vor acht Jahren gegründete britische Unternehmen Graphcore wurde bereits für die Veröffentlichung leistungsstarker KI-Beschleuniger bekannt, die von Microsoft und Dell positiv aufgenommen wurden. Von Graphcore entwickelte Beschleuniger zielen zunächst auf KI ab, was man von NVIDIA-GPUs, die zur Lösung von KI-Problemen angepasst sind, nicht behaupten kann. A
Die auf der Ampere-Architektur basierende NVIDIA A100-Lösung enthält 54 Milliarden Transistoren. Der neue 7-nm-Graphcore-Colossus-MK2-Prozessor (IPU GC200) verfügt über 59,4 Milliarden Transistoren auf seinem Chip. Somit die Krönung des komplexesten Chips der Welt (bis auf das Single-Plate-Monster).
Jeder GC200-Chip verfügt über 1472 unabhängige Prozessorkerne in Form einer Reihe von „Kacheln“ und ist in der Lage, 8832 Rechenthreads parallel auszuführen. Die bisherige Lösung des Unternehmens war ein Beschleuniger mit 1216 Kernen und 7296 Threads. Jede „Kachel“ ist mit einem eigenen Speicherblock ausgestattet. Insgesamt verfügt die Neuentwicklung über 900 MB internen Speicher, während der Vorgängerprozessor nur über 300 MB Speicher verfügte.
Diese Lösung bietet einen enormen Gesamtdurchsatz von Graphcore-Beschleunigern. Somit hat ein Shelf-Computer für ein Standard-Rack mit vier Colossus MK2-Beschleunigern eine Leistung von einem Petaflop. Die gemeinsame Arbeit von 64 IPUs wird eine Leistung von 16 Exaflops liefern. Die Skalierung der Graphcore-Plattform erfolgt durch einfache Erhöhung der Blöcke mit automatischer Konfiguration, was den Nutzerkreis der Beschleuniger des Unternehmens deutlich erweitert.
Früher Microsoft
Source:
Source: 3dnews.ru