Intel pracuje na optických čipech pro efektivnější AI

Fotonické integrované obvody nebo optické čipy mají potenciál nabídnout mnoho výhod oproti svým elektronickým protějškům, jako je nižší spotřeba energie a snížená latence ve výpočetní technice. To je důvod, proč mnoho výzkumníků věří, že mohou být mimořádně efektivní v úlohách strojového učení a vytváření umělé inteligence (AI). Intel v této oblasti vidí také velké vyhlídky pro využití křemíkové fotoniky. Skupina výzkumníků v vědecký článek podrobně popsal nové metody, které mohou optické neuronové sítě přiblížit o krok blíže realitě.

Intel pracuje na optických čipech pro efektivnější AI

V nedávném Příspěvky na blogu Intel, věnující se strojovému učení, vypráví, jak začal výzkum v oblasti optických neuronových sítí. Vědecká práce Davida AB Millera a Michaela Recka prokázala, že typ fotonického obvodu známého jako Mach-Zehnderův interferometr (MZI) lze nakonfigurovat tak, aby prováděl násobení matice 2 × 2, přičemž pokud je MZI umístěn v trojúhelníkové mřížce pro násobení velké matice, můžete získat obvod, který implementuje algoritmus násobení matice-vektor - hlavní výpočet používaný ve strojovém učení.

Nový výzkum společnosti Intel se zaměřil na to, co se stane, když různé vady, kterým jsou optické čipy vystaveny během výroby (protože výpočetní fotonika je svou povahou analogová), způsobují rozdíly ve výpočetní přesnosti mezi různými čipy stejného typu. Přestože podobné studie již byly provedeny, v minulosti se zaměřovaly spíše na optimalizaci po výrobě, aby se eliminovaly případné nepřesnosti. Tento přístup má však špatnou škálovatelnost, protože sítě se zvětšují a zvětšují, což má za následek vyšší výpočetní výkon potřebný k nastavení optických sítí. Namísto post-výrobní optimalizace se Intel zaměřil na možnost jednorázového školení čipů před výrobou pomocí architektury odolné vůči hluku. Referenční optická neuronová síť byla trénována jednou, poté byly trénovací parametry distribuovány do několika vyrobených síťových instancí s rozdíly v jejich komponentách.

Tým Intel zvažoval dvě architektury pro budování systémů umělé inteligence založených na MZI: GridNet a FFTNet. GridNet umísťuje MZI do předvídatelné mřížky, zatímco FFTNet je umísťuje do motýlího vzoru. Po trénování obou simulací hloubkového učení referenčního úkolu (MNIST) pro rozpoznávání ručně psaných číslic vědci zjistili, že GridNet dosáhl vyšší přesnosti než FFTNet (98 % oproti 95 %), ale architektura FFTNet byla „výrazně robustnější“. Ve skutečnosti výkon GridNetu klesl pod 50 % s přidáním umělého šumu (rušení, které napodobuje případné vady při výrobě optických čipů), zatímco u FFTNet zůstal téměř konstantní.

Vědci tvrdí, že jejich výzkum pokládá základy pro tréninkové metody AI, které mohou eliminovat potřebu dolaďovat optické čipy po jejich vyrobení, což šetří cenný čas a zdroje.

„Jako u každého výrobního procesu se vyskytnou určité vady, což znamená, že mezi čipy budou malé rozdíly, které ovlivní přesnost výpočtů,“ píše Casimir Wierzynski, vrchní ředitel skupiny Intel AI Product Group. „Pokud se optické nervové esence stanou životaschopnou součástí hardwarového ekosystému AI, budou muset přejít na větší čipy a průmyslové výrobní technologie. Náš výzkum ukazuje, že výběr správné architektury předem může výrazně zvýšit pravděpodobnost, že výsledné čipy dosáhnou požadovaného výkonu, a to i za přítomnosti výrobních odchylek.“

Zatímco Intel primárně provádí výzkum, MIT Ph.D. Yichen Shen založil bostonský startup Lightelligence, který získal 10,7 milionu dolarů na financování rizikového kapitálu a nedávno prokázáno prototyp optického čipu pro strojové učení, který je 100krát rychlejší než moderní elektronické čipy a navíc řádově snižuje spotřebu energie, což opět jasně demonstruje příslib fotonických technologií.



Zdroj: 3dnews.ru

Přidat komentář