Zapowiedź procesora Cerebras ― Cerebras Wafer Scale Engine (WSE) lub Cerebras Wafer Scale Engine ―
Cerebras WSE jest produkowany przez TSMC. Proces technologiczny: 16 nm FinFET. Temu tajwańskiemu producentowi również należy się pomnik za wypuszczenie Cerebrasa. Produkcja takiego chipa wymagała najwyższych umiejętności i rozwiązania wielu problemów, ale było warto – zapewniają twórcy. Układ Cerebras to w zasadzie superkomputer na chipie o niesamowitej przepustowości, minimalnym zużyciu energii i fantastycznej równoległości. Jest to obecnie idealne rozwiązanie do uczenia maszynowego, które umożliwi badaczom rozpoczęcie rozwiązywania problemów o ekstremalnej złożoności.
Każda matryca Cerebras WSE zawiera 1,2 biliona tranzystorów zorganizowanych w 400 000 rdzeni obliczeniowych zoptymalizowanych pod kątem sztucznej inteligencji i 18 GB lokalnej rozproszonej pamięci SRAM. Wszystko to połączone jest siecią mesh o łącznej przepustowości 100 petabitów na sekundę. Przepustowość pamięci sięga 9 PB/s. Hierarchia pamięci jest jednopoziomowa. Nie ma pamięci podręcznej, nakładania się i minimalnych opóźnień dostępu. Jest to idealna architektura do przyspieszania zadań związanych ze sztuczną inteligencją. Gołe liczby: w porównaniu z najnowocześniejszymi rdzeniami graficznymi, chip Cerebras zapewnia 3000 razy więcej pamięci wbudowanej i 10 000 razy większą prędkość transferu pamięci.
Rdzenie obliczeniowe Cerebras – SLAC (Sparse Linear Algebra Cores) – są w pełni programowalne i można je optymalizować do pracy z dowolnymi sieciami neuronowymi. Co więcej, architektura jądra z natury filtruje dane reprezentowane przez zera. Uwalnia to zasoby obliczeniowe od konieczności wykonywania operacji mnożenia przez zero w stanie bezczynności, co w przypadku rzadkiego ładowania danych oznacza szybsze obliczenia i ekstremalną efektywność energetyczną. Tym samym procesor Cerebras okazuje się setki, a nawet tysiące razy wydajniejszy w uczeniu maszynowym pod względem powierzchni chipa i zużycia, niż obecne rozwiązania w zakresie sztucznej inteligencji i uczenia maszynowego.
Produkcja chipa o podobnej wielkości
Źródło: 3dnews.ru