Создан фотонный процессор для быстрого и экономичного обучения нейросетей
Глубокие нейронные сети состоят из множества взаимосвязанных слоев узлов, или нейронов, которые осуществляют различные операции. Одна из ключевых операций требует использования линейной алгебры для выполнения умножения матриц. Но вдобавок к линейным операциям нейросети выполняют и нелинейные, помогающие моделям ИИ решать более сложные задачи. В 2017 году группа ученых из Массачусетского технологического института показала в действии оптическую нейросеть на одном фотонном чипе, которая выполняла умножение матриц светом. Однако тогда это устройство еще не могло осуществлять нелинейные операции на чипе. Оптические данные приходилось превратить в электрические сигналы и отослать в цифровой процессор для обработки.
«Нелинейность в оптике – довольно сложная проблема, поскольку фотоны с трудом взаимодействуют друг с другом. Для запуска оптической нелинейности требуется очень много энергии, так что сложно создать систему, которая выполняла бы эту задачу масштабируемым образом», - пояснил Саумил Бандиопадхья, руководитель научной группы из MIT.
Он и его команда решили эту проблему, разработав нелинейные оптические функциональные блоки (NOFU), сочетающие электронные и оптические элементы и выполняющие нелинейные операции на чипе. Исследователи собрали на фотонном чипе оптическую нейросеть, использовав три слоя устройств, выполняющих линейные и нелинейные операции, https://news.mit.edu/2024/photonic-processor-could-enable-ul... MIT News.
Вначале система кодирует параметры нейронной сети в свет. Затем массив программируемых светоделителей выполняет умножение матрицы. Полученные данные отправляются в программируемые блоки NOFU, которые осуществляют нелинейные функции. В ходе этого процесса небольшое количество света попадает в фотодиоды, которые преобразуют оптические сигналы в электрический ток. Этот процесс устраняет необходимость во внешнем усилителе и потребляет очень мало энергии.
Устройство почти все время работает в оптическом режиме. Это позволяет сократить время ожидания и увеличить эффективность обучения нейросети на чипе. Обычно такой процесс обучения in situ потребляет огромное количество энергии.
В ходе испытаний фотонная система показала 96% точности в задачах на обучение и более 92% точности в задачах с помехами. Эти показатели сопоставимы с производительностью традиционный вычислительных устройств. Вдобавок, чип выполнил ключевые вычисления менее чем за половину наносекунды.
Вся схема изготовлена при помощи того же оборудования и производственных процессов, которые используются в производстве интегральных микросхем по технологиям КМОП. Это значит, что этот чип можно изготавливать массово, при помощи проверенной временем технологии.
Почти год назад ученые из Гонконга https://hightech.plus/2024/02/28/razrabotan-prorivnoi-mikrov... инновационный микроволновой фотонный чип из ниобата лития, способный работать намного быстрее, чем традиционные электронные процессоры. Вдобавок он потребляет меньше энергии.