Добавить новость
ru24.net
Интернет
Декабрь
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
30
31

Китайская DeepSeek выпустила мощную и открытую ИИ-модель с 671 млрд параметров

0

Китайский ИИ-стартап DeepSeek выпустил DeepSeek V3, языковую модель с открытым исходным кодом на 671 миллиард параметров. Модель, обучение которой обошлось в 5,5 миллионов долларов с использованием графических процессоров Nvidia H800, получила высокую оценку за эффективность и производительность.

DeepSeek V3 превзошла таких конкурентов, как OpenAI GPT-4 в бенчмарках по программированию. Модель, обученная на 14,8 триллионах токенов за два месяца, в 1,6 раза больше, чем *Llama 3.1, но требует значительных вычислительных мощностей для эффективной работы.

Бывший руководитель OpenAI Андрей Карпати подчеркнул это достижение, отметив, что DeepSeek V3 достигла своей производительности за гораздо меньшее количество часов работы GPU, чем сопоставимые модели. Ей потребовалось 2,8 миллиона GPU-часов, что гораздо меньше, чем 30,8 миллиона GPU-часов, использованных для *Llama 3 405B.

*принадлежит Meta, которая признана в РФ экстремистской и запрещена




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Юлия Путинцева

Теннисистка Путинцева: решила выступать за Казахстан из-за лучших условий






Как сообщают в компании Chery, подведены итоги продаж на маркетплейсах в России.

ФИНАМ рассказал, как акции российского IT-сектора заканчивают 2024 год

В Москве полиция раскрыла подпольный цех с контрафактной парфюмерией

Доброе сердце Волшебника. Путешествие с НТВ Дед Мороз завершил в Москве