Исследователи разрабатывают усовершенствованное устройство, которое сделает искусственный интеллект более энергоэффективным
Исследователи-инженеры из Университета городов-побратимов Миннесоты продемонстрировали высокотехнологичное устройство, которое может снизить энергопотребление вычислительных приложений искусственного интеллекта как минимум в 1000 раз.
Исследование было опубликовано в npj нетрадиционные вычисления, рецензируемый научный журнал, издаваемый журналом Nature. Исследователи получили несколько патентов на технологию, используемую в устройстве.
В условиях растущего спроса на приложения искусственного интеллекта исследователи ищут способы создать более энергоэффективный процесс, сохраняя при этом высокую производительность и низкие затраты. Обычно процессы машины или искусственного интеллекта передают данные между логикой (где информация обрабатывается внутри системы) и памятью (где данные хранятся), потребляя большое количество энергии.
Команда исследователей из Колледжа науки и техники Университета Миннесоты продемонстрировала новую модель, в которой данные никогда не покидают память, называемую вычислительной оперативной памятью (CRAM).
«Эта работа является первой экспериментальной демонстрацией сжатой оперативной памяти (CRAM), где данные могут быть полностью обработаны внутри массива памяти, не покидая сети, где они хранятся», — сказал Ян Лув, постдокторант из Департамента Электротехника и вычислительная техника из Университета Миннесоты и первый автор компьютерной информации.
Международное энергетическое агентство (МЭА) опубликовало глобальные прогнозы энергопотребления в марте 2024 года, прогнозируя, что потребление энергии для искусственного интеллекта, вероятно, удвоится с 460 тераватт-часов (ТВт-ч) в 2022 году до 1000 ТВт-ч в 2026 году. Это примерно эквивалентно потреблению электроэнергии. Во всей Японии.
По мнению авторов нового исследования, ожидается, что ускоритель вывода на основе машинного обучения CRAM достигнет улучшения примерно в 1000 раз. Другой пример показал экономию энергии в 2500 и 1700 раз по сравнению с традиционными методами.
Это исследование заняло более двух десятилетий,
Цзяньпин Ван, ведущий автор исследования и заслуженный профессор Макнайта, и Роберт Ф. «Нашу первоначальную концепцию использования ячеек памяти непосредственно в вычислениях 20 лет назад сочли бы сумасшедшей», — говорит Хартманн с факультета электротехники и вычислительной техники Университета Миннесоты.
«Благодаря передовой группе студентов с 2003 года и междисциплинарной команде преподавателей, созданной в Университете Миннесоты — от физики, материаловедения и инженерии, информатики и инженерии до моделирования, калибровки и создания устройств — мы смогли получили положительные результаты и теперь доказали, что этот тип технологии жизнеспособен и готов к интеграции в технологию».
Это исследование является частью сплоченных, долгосрочных усилий, основанных на новаторских запатентованных исследованиях, проведенных Ваном и его коллегами в области магнитных туннельных переходов (MTJ), наноструктурных устройств, используемых для улучшения жестких дисков, датчиков и других микроэлектронных систем. в том числе… Сюда входит магнитная оперативная память (MRAM), которая используется во встроенных системах, таких как микроконтроллеры и умные часы.
Конструкция CRAM позволяет выполнять реальные арифметические операции в памяти и с ней, а также устраняет стену между арифметическими операциями и памятью, которая является узким местом в традиционной архитектуре фон Неймана — теоретической конструкции компьютера с хранимой программой, которая служит основой для почти все современные компьютеры.
«Являясь высокоэнергетической основой цифровых вычислений, выделяемая оперативная память очень гибка, поскольку вычисления могут выполняться в любом месте массива памяти. Соответственно, мы можем переконфигурировать выделяемую оперативную память, чтобы лучше соответствовать потребностям в производительности различных алгоритмов искусственного интеллекта». интеллекта», — сказала Олия Карбозко, эксперт в области вычислительной техники, соавтор статьи и доцент кафедры электротехники и вычислительной техники Университета Миннесоты. «Он более энергоэффективен, чем традиционные строительные блоки сегодняшних систем искусственного интеллекта».
Карбозко пояснил, что технология CRAM выполняет вычисления непосредственно внутри ячеек памяти, эффективно используя преимущества матричной структуры, что устраняет необходимость в медленной передаче данных, требующей много энергии.
Наиболее эффективные устройства SRAM используют четыре или пять транзисторов для кодирования единицы или нуля, но одно гироэлектронное устройство может выполнять ту же функцию при гораздо меньшей мощности и с более высокой скоростью и устойчиво к суровым условиям окружающей среды. Устройства спинтроники для хранения данных используют вращение электронов, а не электрический заряд, обеспечивая более эффективную альтернативу традиционным чипам на основе транзисторов.
Прямо сейчас команда планирует работать с лидерами полупроводниковой отрасли, в том числе из Миннесоты, чтобы провести крупномасштабные демонстрации и создать оборудование, необходимое для улучшения функциональности искусственного интеллекта.
Помимо Льва, Ванга и Карпузку, в команду входили исследователи Роберт Блум и Хусрев Силасун с факультета электротехники и вычислительной техники Университета Миннесоты; заслуженный профессор Макнайта и заведующий кафедрой Роберта и Марджори Хенле Сачин Сапатнекар; бывшие постдокторанты Брэндон Зинк, Замшед Чоудхури и Салоник Реш; Вместе с исследователями из Университета Аризоны: Правином Ханалом, Али Хабибоглу и профессором Вейганом Вангом.
Эта работа была поддержана грантами Агентства перспективных исследовательских проектов Министерства обороны США (DARPA), Национального института стандартов и технологий (NIST), Национального научного фонда (NSF) и Cisco Inc. Исследование, включая модели наноустройств, проводилось в сотрудничестве с Миннесотским наноцентром, а симуляционные/вычислительные работы проводились с Миннесотским суперкомпьютерным институтом при Университете Миннесоты. Чтобы прочитать полную статью под названием «Экспериментальная демонстрация случайной вычислительной памяти на основе магнитного туннелирования», посетите сайт npj нетрадиционные вычисления Веб-сайт.