Intel jobber med optiske brikker for mer effektiv AI

Fotoniske integrerte kretser, eller optiske brikker, gir potensielt mange fordeler i forhold til deres elektroniske motparter, for eksempel redusert strømforbruk og redusert ventetid i beregningen. Det er derfor mange forskere tror at de kan være ekstremt effektive i maskinlæring og kunstig intelligens (AI) oppgaver. Intel ser også store muligheter for bruk av silisiumfotonik i denne retningen. Forskerteamet hennes i vitenskapelig artikkel detaljerte nye teknikker som kan bringe optiske nevrale nettverk et skritt nærmere virkeligheten.

Intel jobber med optiske brikker for mer effektiv AI

I en nylig Intel blogginnlegg, dedikert til maskinlæring, beskriver hvordan forskning innen optiske nevrale nettverk begynte. Forskning av David AB Miller og Michael Reck har vist at en type fotonisk krets kjent som et Mach-Zehnder interferometer (MZI) kan konfigureres til å utføre 2 × 2 matrisemultiplikasjon når den plasseres MZI på et trekantet nett for å multiplisere store matriser. få en krets som implementerer matrise-vektor multiplikasjonsalgoritmen, en grunnleggende beregning som brukes i maskinlæring.

Ny Intel-forskning fokuserte på hva som skjer når ulike defekter som optiske brikker er mottakelige for under produksjon (siden beregningsfotonikk er analog av natur) forårsaker forskjeller i beregningsnøyaktighet mellom ulike brikker av samme type. Selv om lignende studier har blitt utført, har de tidligere fokusert mer på optimalisering etter produksjon for å eliminere mulige unøyaktigheter. Men denne tilnærmingen har dårlig skalerbarhet ettersom nettverkene blir større, noe som resulterer i en økning i datakraften som kreves for å sette opp optiske nettverk. I stedet for optimalisering etter produksjon, vurderte Intel å trene brikker én gang før produksjon ved å bruke en støytolerant arkitektur. Det optiske nevrale referansenettverket ble trent en gang, hvoretter treningsparametrene ble fordelt over flere fabrikkerte nettverksforekomster med forskjeller i komponentene.

Intel-teamet vurderte to arkitekturer for å bygge kunstig intelligens-systemer basert på MZI: GridNet og FFTNet. GridNet plasserer forutsigbart MZI-er i et rutenett, mens FFTNet plasserer dem i sommerfugler. Etter å ha trent begge i en simulering på den håndskrevne siffergjenkjenningsoppgaven for dyp læring (MNIST), fant forskerne at GridNet oppnådde høyere nøyaktighet enn FFTNet (98 % vs. 95 %), men FFTNet-arkitekturen var «betydelig mer robust». Faktisk falt GridNets ytelse under 50 % med tillegg av kunstig støy (interferens som simulerer mulige defekter i produksjon av optiske brikker), mens den for FFTNet forble nesten konstant.

Forskerne sier at forskningen deres legger grunnlaget for treningsmetoder for kunstig intelligens som kan eliminere behovet for å finjustere optiske brikker etter at de er produsert, noe som sparer verdifull tid og ressurser.

"Som med enhver produksjonsprosess, vil visse defekter oppstå som betyr at det vil være små forskjeller mellom brikker som vil påvirke nøyaktigheten av beregningene," skriver Casimir Wierzynski, seniordirektør for Intel AI Product Group. "Hvis optiske nevrale enheter skal bli en levedyktig del av AI-maskinvareøkosystemet, må de gå over til større brikker og industrielle produksjonsteknologier. Vår forskning viser at å velge riktig arkitektur på forhånd kan øke sannsynligheten betydelig for at de resulterende brikkene vil oppnå ønsket ytelse, selv i nærvær av produksjonsvariasjoner.»

Samtidig som Intel primært driver forskning, grunnla MIT PhD-kandidat Yichen Shen den Boston-baserte oppstarten Lightelligence, som har samlet inn 10,7 millioner dollar i risikofinansiering og nylig demonstrert en prototype optisk brikke for maskinlæring som er 100 ganger raskere enn moderne elektroniske brikker og som også reduserer strømforbruket med en størrelsesorden, noe som nok en gang tydelig demonstrerer løftet om fotoniske teknologier.



Kilde: 3dnews.ru

Legg til en kommentar