Китайский ИИ наступает: стоит ли переходить на Qwen2.5-Max?
Alibaba представила новую модель Qwen2.5-Max, построенную на архитектуре Mixture-of-Experts (MoE). Она прошла предварительное обучение на 20+ триллионах токенов и дополнительно дообучена с использованием методов контролируемого обучения (SFT) и обучения с подкреплением на основе обратной связи от человека (RLHF). «На первый взгляд Qwen выглядит как привычный чат-бот, интерфейс интуитивно понятен. Сервис доступен в России, регистрация проходит […]