Intel pracuje na optických čipoch pre efektívnejšiu AI

Fotonické integrované obvody alebo optické čipy potenciálne ponúkajú mnoho výhod oproti svojim elektronickým náprotivkom, ako je znížená spotreba energie a znížená latencia pri výpočte. To je dôvod, prečo mnohí výskumníci veria, že môžu byť mimoriadne efektívne v úlohách strojového učenia a umelej inteligencie (AI). Intel v tomto smere vidí veľké vyhliadky aj na využitie kremíkovej fotoniky. Jej výskumný tím v vedecký článok podrobne opísali nové techniky, ktoré by mohli priniesť optické neurónové siete o krok bližšie k realite.

Intel pracuje na optických čipoch pre efektívnejšiu AI

V nedávnom Blogové príspevky Intel, venovaný strojovému učeniu, popisuje, ako začal výskum v oblasti optických neurónových sietí. Výskum Davida A. B. Millera a Michaela Recka preukázal, že typ fotonického obvodu známy ako Mach-Zehnderov interferometer (MZI) možno nakonfigurovať tak, aby vykonával násobenie matice 2 × 2, kde, ak sa MZI umiestni na trojuholníkovú sieť na násobenie veľkých matíc. je možné získať obvod, ktorý implementuje algoritmus násobenia maticových vektorov, základný výpočet používaný v strojovom učení.

Nový výskum spoločnosti Intel sa zameral na to, čo sa stane, keď rôzne chyby, na ktoré sú optické čipy náchylné počas výroby (keďže výpočtová fotonika je svojou povahou analógová), spôsobujú rozdiely vo výpočtovej presnosti medzi rôznymi čipmi rovnakého typu. Aj keď sa podobné štúdie robili, v minulosti sa zameriavali skôr na optimalizáciu po výrobe, aby sa eliminovali prípadné nepresnosti. Tento prístup má však slabú škálovateľnosť, pretože siete sa zväčšujú, čo vedie k zvýšeniu výpočtového výkonu potrebného na nastavenie optických sietí. Namiesto optimalizácie po výrobe Intel zvažoval jednorazové školenie čipov pred výrobou pomocou architektúry odolnej voči hluku. Referenčná optická neurónová sieť bola trénovaná raz, potom boli trénovacie parametre distribuované cez niekoľko vyrobených sieťových inštancií s rozdielmi v ich komponentoch.

Tím Intel zvažoval dve architektúry na budovanie systémov umelej inteligencie založených na MZI: GridNet a FFTNet. GridNet predvídateľne umiestňuje MZI do mriežky, zatiaľ čo FFTNet ich umiestňuje do motýľov. Po trénovaní oboch v simulácii na benchmarkovú úlohu pre rozpoznávanie ručne písaných číslic (MNIST) výskumníci zistili, že GridNet dosiahol vyššiu presnosť ako FFTNet (98 % vs. 95 %), ale architektúra FFTNet bola „výrazne robustnejšia“. V skutočnosti výkon GridNetu klesol pod 50 % s pridaním umelého šumu (interferencie, ktorá simuluje možné defekty pri výrobe optických čipov), zatiaľ čo pre FFTNet zostal takmer konštantný.

Vedci tvrdia, že ich výskum položil základy pre tréningové metódy umelej inteligencie, ktoré by mohli eliminovať potrebu dolaďovania optických čipov po ich výrobe, čím by sa ušetril drahocenný čas a zdroje.

„Ako pri každom výrobnom procese sa vyskytnú určité chyby, ktoré znamenajú, že medzi čipmi budú malé rozdiely, ktoré ovplyvnia presnosť výpočtov,“ píše Casimir Wierzynski, senior riaditeľ Intel AI Product Group. „Ak sa optické neurónové entity majú stať životaschopnou súčasťou hardvérového ekosystému AI, budú musieť prejsť na väčšie čipy a priemyselné výrobné technológie. Náš výskum ukazuje, že výber správnej architektúry vopred môže výrazne zvýšiť pravdepodobnosť, že výsledné čipy dosiahnu požadovaný výkon, a to aj v prípade výrobných variácií.“

V rovnakom čase, keď Intel primárne vykonáva výskum, kandidát na doktorandské štúdium MIT Yichen Shen založil bostonský startup Lightelligence, ktorý získal 10,7 milióna dolárov na rizikové financovanie a nedávno preukázané prototyp optického čipu pre strojové učenie, ktorý je 100-krát rýchlejší ako moderné elektronické čipy a tiež rádovo znižuje spotrebu energie, čo opäť jasne demonštruje prísľub fotonických technológií.



Zdroj: 3dnews.ru

Pridať komentár