Добавить новость
ru24.net
Блог сайта «Хайтек+»
Январь
2025
1
2
3
4
5
6
7
8 9 10
11
12 13 14 15 16 17
18
19 20 21 22 23 24
25
26 27 28 29 30
31

Alibaba представила Qwen2.5-Max — конкурента GPT-4o и DeepSeek V1

Qwen2.5-Max была обучена на более чем 20 трлн токенов с использованием архитектуры со «смешанных экспертов» (Mixture-of-Experts, MoE), которая требует гораздо меньше вычислительных ресурсов, чем традиционные подходы. Модель активирует только определенные компоненты нейронной сети для каждой задачи. В результате конкурентоспособная производительность ИИ достигается без массивных кластеров GPU. Это позволяет компаниям сократить затраты на инфраструктуру до 40-60% по сравнению с традиционными решениями.

Модель Qwen2.5-Max продемонстрировала выдающиеся результаты в серии тестов, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Она превзошла версию DeepSeek V3 по таким показателям, как способность к логическому рассуждению, генерации кода и общему пониманию языка. Кроме того, Qwen2.5-Max продемонстрировала конкурентоспособные результаты по сравнению с другими ведущими моделями на рынке — GPT-4o и Claude-3.5-Sonnet.

Этот подход может изменить дорожные карты по внедрению корпоративного ИИ. Вместо того, чтобы вкладывать большие средства в расширение центров обработки данных и кластеры GPU, технические руководители могли бы отдать приоритет архитектурной оптимизации и развертыванию модели.

Qwen2.5-Max доступна всем желающим через Qwen Chat. Разработчики могут использовать модель через API Alibaba Cloud. Сервис предлагает возможности, аналогичные ведущим американским моделям, но по более низким ценам.

Два китайских релиза в сфере ИИ, от Alibaba и https://hightech.plus/2025/01/28/kitaiskii-startap-deepseek-..., усилили беспокойство Уолл-стрит по поводу технологического превосходства США. Очевидно, что Китай, несмотря на ограниченный доступ к передовым чипам, может развивать ИИ устойчивым путем. В то время как американские компании делают ставку на масштабирование через вычислительную мощность (например, OpenAI использует более 32 000 GPU для своих моделей), китайские разработчики добиваются успеха за счет архитектуры и оптимизации ресурсов.

Перед гигантами американской технологической отрасли теперь стоит двойная задача: удовлетворить текущий спрос рынка и одновременно строить долгосрочную стратегию развития, учитывая, что преимущества в аппаратном обеспечении — уже не гарантия лидерства.




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Российская теннисистка Касаткина вылетела из топ-10 рейтинга WTA






В России родился мальчик-гигант весом более пяти килограммов

Бросившего младенца в снег блогера Косенко оштрафовали за пропаганду наркотиков

В «Русале» рассказали об увеличении мощности по выпуску сырья для газобетона

Вдохнуть жизнь в инструмент