Intel arbetar med optiska chips för effektivare AI

Fotoniska integrerade kretsar, eller optiska chips, erbjuder potentiellt många fördelar jämfört med sina elektroniska motsvarigheter, såsom minskad strömförbrukning och minskad latens i beräkningar. Det är därför många forskare tror att de kan vara extremt effektiva i maskininlärning och artificiell intelligens (AI) uppgifter. Intel ser också stora möjligheter för användningen av kiselfotonik i denna riktning. Hennes forskargrupp i vetenskaplig artikel detaljerade nya tekniker som kan föra optiska neurala nätverk ett steg närmare verkligheten.

Intel arbetar med optiska chips för effektivare AI

I en nyligen Intel blogginlägg, tillägnad maskininlärning, beskriver hur forskning inom området optiska neurala nätverk började. Forskning av David AB Miller och Michael Reck har visat att en typ av fotonisk krets känd som en Mach-Zehnder interferometer (MZI) kan konfigureras för att utföra 2 × 2 matrismultiplikation när den placeras MZI på ett triangulärt nät för att multiplicera stora matriser. skaffa en krets som implementerar matris-vektor multiplikationsalgoritmen, en grundläggande beräkning som används i maskininlärning.

Ny Intel-forskning fokuserade på vad som händer när olika defekter som optiska chips är känsliga för under tillverkning (eftersom beräkningsfotonik är analog till sin natur) orsakar skillnader i beräkningsnoggrannhet mellan olika chip av samma typ. Även om liknande studier har utförts, fokuserade de tidigare mer på optimering efter tillverkning för att eliminera eventuella felaktigheter. Men detta tillvägagångssätt har dålig skalbarhet när nätverken blir större, vilket resulterar i en ökning av den datorkraft som krävs för att sätta upp optiska nätverk. Istället för optimering efter tillverkning, övervägde Intel att träna chips en gång före tillverkning genom att använda en buller-tolerant arkitektur. Det optiska neurala referensnätverket tränades en gång, varefter träningsparametrarna fördelades över flera tillverkade nätverksinstanser med skillnader i deras komponenter.

Intel-teamet övervägde två arkitekturer för att bygga artificiell intelligens baserade på MZI: GridNet och FFTNet. GridNet placerar förutsägbart MZIs i ett rutnät, medan FFTNet placerar dem i fjärilsmönster. Efter att ha tränat båda i en simulering av den handskrivna sifferigenkänningsuppgiften för djupinlärning (MNIST), fann forskarna att GridNet uppnådde högre noggrannhet än FFTNet (98 % mot 95 %), men FFTNet-arkitekturen var "betydligt mer robust." Faktum är att GridNets prestanda sjönk under 50 % med tillägg av artificiellt brus (störningar som simulerar möjliga defekter vid tillverkning av optiska chip), medan den för FFTNet förblev nästan konstant.

Forskarna säger att deras forskning lägger grunden för träningsmetoder för artificiell intelligens som skulle kunna eliminera behovet av att finjustera optiska chips efter att de har producerats, vilket sparar värdefull tid och resurser.

"Som med alla tillverkningsprocesser kommer vissa defekter att uppstå som innebär att det kommer att finnas små skillnader mellan chips som kommer att påverka noggrannheten i beräkningarna", skriver Casimir Wierzynski, senior director för Intel AI Product Group. "Om optiska neurala enheter ska bli en livskraftig del av ekosystemet för AI-hårdvara måste de gå över till större chips och industriell tillverkningsteknik. Vår forskning visar att att välja rätt arkitektur i förväg kan avsevärt öka sannolikheten för att de resulterande chipsen kommer att uppnå önskad prestanda, även i närvaro av tillverkningsvariationer."

Samtidigt som Intel främst bedriver forskning grundade MIT-doktorand Yichen Shen den Boston-baserade startupen Lightelligence, som har samlat in 10,7 miljoner dollar i riskfinansiering och nyligen demonstrerat en prototyp av optiskt chip för maskininlärning som är 100 gånger snabbare än moderna elektroniska chip och dessutom minskar strömförbrukningen med en storleksordning, vilket återigen tydligt visar löftet om fotonisk teknik.



Källa: 3dnews.ru

Lägg en kommentar