Alibaba представила Qwen2.5-Max — конкурента GPT-4o и DeepSeek V1
Qwen2.5-Max была обучена на более чем 20 трлн токенов с использованием архитектуры со «смешанных экспертов» (Mixture-of-Experts, MoE), которая требует гораздо меньше вычислительных ресурсов, чем традиционные подходы. Модель активирует только определенные компоненты нейронной сети для каждой задачи. В результате конкурентоспособная производительность ИИ достигается без массивных кластеров GPU. Это позволяет компаниям сократить затраты на инфраструктуру до 40-60% по сравнению с традиционными решениями.
Модель Qwen2.5-Max продемонстрировала выдающиеся результаты в серии тестов, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Она превзошла версию DeepSeek V3 по таким показателям, как способность к логическому рассуждению, генерации кода и общему пониманию языка. Кроме того, Qwen2.5-Max продемонстрировала конкурентоспособные результаты по сравнению с другими ведущими моделями на рынке — GPT-4o и Claude-3.5-Sonnet.
Этот подход может изменить дорожные карты по внедрению корпоративного ИИ. Вместо того, чтобы вкладывать большие средства в расширение центров обработки данных и кластеры GPU, технические руководители могли бы отдать приоритет архитектурной оптимизации и развертыванию модели.
Qwen2.5-Max доступна всем желающим через Qwen Chat. Разработчики могут использовать модель через API Alibaba Cloud. Сервис предлагает возможности, аналогичные ведущим американским моделям, но по более низким ценам.
Два китайских релиза в сфере ИИ, от Alibaba и https://hightech.plus/2025/01/28/kitaiskii-startap-deepseek-..., усилили беспокойство Уолл-стрит по поводу технологического превосходства США. Очевидно, что Китай, несмотря на ограниченный доступ к передовым чипам, может развивать ИИ устойчивым путем. В то время как американские компании делают ставку на масштабирование через вычислительную мощность (например, OpenAI использует более 32 000 GPU для своих моделей), китайские разработчики добиваются успеха за счет архитектуры и оптимизации ресурсов.
Перед гигантами американской технологической отрасли теперь стоит двойная задача: удовлетворить текущий спрос рынка и одновременно строить долгосрочную стратегию развития, учитывая, что преимущества в аппаратном обеспечении — уже не гарантия лидерства.