Добавить новость
ru24.net
Новости по-русски
Июнь
2024

Nvidia выкатила нейросеть Nemotron-4 340B — настоящую «убийцу» GPT-4o

0

Это бесплатное семейство нейросетей, которое найдет широкое применение, в том числе для обучения генеративного ИИ.

14 июня компания Nvidia представила серию открытых моделей Nemotron-4 340B, которые разработчики могут использовать для создания синтетических данных. Они предназначены для применения в коммерции, включая здравоохранение, финансы, производство и розничную торговлю. Качественные обучающие данные — ключевой фактор для эффективной работы LLM, но надёжные наборы данных могут быть слишком дорогими и труднодоступными. Nemotron-4 340B даёт разработчикам бесплатный и масштабируемый способ создания синтетических данных.

Ее обучали на более чем 50 языках естественного общения и свыше 40 языках программирования — всего на 9 трлн токенах. Архитектура языковой модели основана на двух методах: Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE). Однако длина контекста в модели ограничена 4096 токенами.

Модель представлена в виде Nemotron-4−340B-Base, Nemotron-4−340B-Instruct и Nemotron-4−340B-Reward, где:

Base — отвечает за генерацию синтетических данных;Instruct — отвечает за ведение чата и выполнение инструкций;Reward — base-модель с дополнительным линейным слоем для обучения с использованием нового reward-подхода.



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Мирра Андреева близка к победе на WTA в Дубае после блестящего старта






Раненый боец 10 часов полз под ударами дронов, чтобы выжить ради дочери

"Иисус из УСБ": РАСКРЫТА ТАЙНА: КАК ЕВРОПЕЙЦЫ ХОТЯТ РОССИЮ ЗАХВАТИТЬ. Новости. СЕНСАЦИЯ! ЭТО НЕ СЕКРЕТНАЯ ИНФОРМАЦИЯ. Россия, США, Европа могут улучшить отношения и здоровье общества?!

Новый штраф за старую плиту: кого коснется нововведение и сколько придется платить

Бивол победил Бетербиева и стал абсолютным чемпионом