Добавить новость
ru24.net
Все новости
Декабрь
2024

Добро пожаловать в CAMELoT

0

Большие языковые модели (LLM) сталкиваются с трудностями при обработке длинных входных последовательностей из-за высоких затрат памяти и времени выполнения. Модели с расширенной памятью стали многообещающим решением этой проблемы, но текущие методы ограничены объёмом памяти и требуют дорогостоящего повторного обучения для интеграции с новой LLM. В этой статье мы познакомимся с модулем ассоциативной памяти, который может быть связан с любой предварительно обученной LLM без повторного обучения, что позволяет ему обрабатывать произвольно длинные входные последовательности.

В отличие от предыдущих методов этот модуль ассоциативной памяти объединяет представления отдельных токенов в непараметрическую модель распределения. Эта модель управляется динамически путём надлежащего балансирования новизны и свежести входящих данных. Извлекая информацию из консолидированной ассоциативной памяти, базовый LLM на стандартных тестах достигает лучших результатов. Эта архитектура называется CAMELoT (Consolidated Associationive Memory Enhanced Long Transformer). Она демонстрирует превосходную производительность даже при крошечном контекстном окне в 128 токенов, а также обеспечивает улучшенное контекстное обучение с гораздо большим набором демонстраций.

Читать далее



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Теннисистка Потапова стремится в топ-20 мирового рейтинга WTA в 2024 году






"В России есть Wi-Fi?!": Простой вопрос американца сдал пропагандистов - блогер Эдин Росс тут же прозрел

Сергей Собянин пригласил москвичей присоединиться к акции «Москва помогает»

Спустившийся с крыши Дед Мороз поздравил детей в онкодиспансере Подмосковья

Главный синоптик России Роман Вильфанд пообещал возвращение мартовских температур - обновлен прогноз