Intel працює над оптичними чіпами для більш ефективного ІІ

Фотонні інтегральні схеми або оптичні чіпи потенційно мають безліч переваг у порівнянні з електронними аналогами, такими як зниження енергоспоживання та зменшення затримки у обчисленнях. Ось чому багато дослідників вважають, що вони можуть виявитися вкрай ефективними у завданнях машинного навчання та створення штучного інтелекту (ІІ). Компанія Intel також бачить великі перспективи застосування кремнієвої фотоніки в даному напрямку. Група її дослідників у науковій статті Докладно описала нові методи, які можуть наблизити оптичні нейронні мережі на крок ближче до реальності.

Intel працює над оптичними чіпами для більш ефективного ІІ

У недавній публікації у блозі Intel, присвяченому машинному навчанню, розповідається, як розпочиналися дослідження в галузі оптичних нейронних мереж. Наукові роботи Девіда Міллера (David AB Miller) та Майкла Река (Michael Reck) продемонстрували, що тип фотонного ланцюга, відомий як інтерферометр Маха-Цендера (MZI), може бути налаштований для виконання перемноження матриць розміром 2×2, при цьому якщо розмістити MZI в трикутній сітці для перемноження великих матриць можна отримати схему, яка реалізує алгоритм множення матриці на вектор - основне обчислення, що використовується в машинному навчанні.

Нове дослідження Intel зосередилося на вивченні того, що відбувається при появі різних дефектів, яким схильні оптичні чіпи при виробництві (оскільки обчислювальна фотоніка є аналоговою за своєю природою), що викликають відмінності в точності обчислень між різними чіпами одного типу. Хоча такі дослідження вже проводилися, у минулому вони були зосереджені більше на оптимізації після виготовлення для усунення можливих неточностей. Але цей підхід має погану масштабованість, оскільки мережі стають все більшими у розмірах, що призводить до збільшення обчислювальної потужності, необхідної для налаштування оптичних мереж. Замість оптимізації після виготовлення Intel розглянула можливість одноразового навчання чипів перед виготовленням завдяки використанню стійкої до архітектурних перешкод. Еталонна оптична нейронна мережа була навчена один раз, після чого параметри навчання були розподілені за декількома сфабрикованими примірниками мережі з відмінностями в їх компонентах.

Команда Intel розглянула дві архітектури для побудови систем штучного інтелекту на базі MZI: GridNet та FFTNet. GridNet передбачувано розміщує MZI у сітці, а FFTNet розміщує їх у вигляді «метеликів». Після навчання обох у моделюванні на еталонній задачі глибокого навчання розпізнаванню рукописних цифр (MNIST), дослідники виявили, що GridNet досягла вищої точності, ніж FFTNet (98% проти 95%), але при цьому архітектура FFTNet виявилася «значно надійнішою». Практично продуктивність GridNet впала нижче 50 % з додаванням штучного шуму (перешкод, що імітують потенційні недоліки для виробництва оптичних чіпів), тоді як для FFTNet вона залишалася майже незмінною.

Вчені стверджують, що їхні дослідження закладають основу для методів навчання штучного інтелекту, які допоможуть позбавитися необхідності тонкого налаштування оптичних чіпів після їх виробництва, заощаджуючи дорогоцінний час та ресурси.

Як і в будь-якому виробничому процесі, виникають певні дефекти, які означають, що між мікросхемами будуть невеликі відмінності, і вони впливатимуть на точність обчислень, пише старший директор групи продуктів Intel AI Казимир Вежинскі (Casimir Wierzynski). «Якщо оптичні нейронні суті стануть життєздатною частиною апаратної екосистеми штучного інтелекту, їм потрібно буде перейти на більші мікросхеми та технології промислового виробництва. Наші дослідження показують, що вибір правильної архітектури наперед може значно збільшити ймовірність того, що отримані мікросхеми досягнуть бажаної продуктивності навіть за наявності виробничих варіацій».

У той же час, поки Intel в основному проводить дослідження, кандидат фізико-математичних наук з Массачусетського технологічного інституту Ішен Шен (Yichen Shen) заснував стартап Lightelligence, що базується в Бостоні, який залучив венчурне фінансування на суму 10,7 млн. доларів США і нещодавно продемонстрував прототип оптичного чіпа для машинного навчання, який у 100 разів швидше за сучасні електронні чіпи, а також на порядок знижує енергоспоживання, що ще раз наочно демонструє перспективи фотонних технологій.



Джерело: 3dnews.ru

Додати коментар або відгук