Никакого чуда китайская нейросеть DeepSeek из себя не представляет? Затраты на её обучение могли быть в 400 раз выше заявленных

01.02.2025 21:35

Возможно, китайская языковая модель DeepSeek, запуск которой обвалил фондовый рынок США и привёл к падению капитализации Nvidia на невероятные 600 млрд долларов, на самом деле обошлась китайской компании не в разы, а на порядки дороже, чем сообщалось.

создано DALL-E

Напомним, затраты на обучение модели якобы составили всего 5-6 млн долларов, что поражает на фоне сотен миллионов, которые тратят западные гиганты. Однако аналитики SemiAnalysis провели анализ имеющихся данных и сообщают, что на самом деле затраты DeepSeek были примерно на два порядка выше заявленных!

фото SemiAnalysis

В отчете говорится, что DeepSeek имеет около 10 000 графических процессоров Nvidia H800, предназначенных для китайского рынка, и 10 000 более дорогих чипов H100. Более того, компания инвестировала в ускорители H20, и у них есть пул ресурсов, которые DeepSeek и китайский хедж-фонд High-Flyer совместно используют для торговли, вывода, обучения и исследований. Суммарно всё это уже тянет …

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Никакого чуда китайская нейросеть DeepSeek из себя не представляет? Затраты на её обучение могли быть в 400 раз выше заявленных

Новости спорта

Медведев оставил ироничную надпись на камере на турнире ATP в Индиан-Уэллсе

С 11 марта в Москве потеплеет до +16 градусов

Главой Минтранса Карелии хотят назначить зоотехника по образованию

«Мы вместе!» Shaman подтвердил, что встречается с Екатериной Мизулиной

Пожар в Подмосковье: четыре погибших в тепличном комплексе на 1050 м²