Новые китайские ИИ-модели не слабее ведущих западных
MiniMax заявляет, что модель MiniMax-Text-01 (456 млрд параметров) показывает лучшие результаты, чем, например, Google Gemini 2.0 Flash, в тестах MMLU и SimpleQA, которые проверяют умение модели решать математические задачи и отвечать на фактические вопросы. В свою очередь, MiniMax-VL-01 может конкурировать с Claude 3.5 Sonnet (Anthropic) в задачах, требующих анализа данных из разных источников. В частности, в тесте ChartQA нужно отвечать на вопросы по графикам и диаграммам (например, «Какое максимальное значение у оранжевой линии на этом графике?»). При этом MiniMax-VL-01 уступает Gemini 2.0 Flash во многих подобных тестах. Модели GPT-4o (OpenAI) и открытая модель InternVL2.5 также показывают лучшие результаты в некоторых случаях.
С контекстным окном в 4 млн токенов MiniMax-Text-01 может обработать 3 млн слов за один раз — это чуть больше пяти копий «Войны и мир». Для сравнения, контекстное окно MiniMax-Text-01 примерно в 31 раз больше, чем у GPT-4o и Llama 3.1.
Последняя из представленных моделей MiniMax, T2A-01-HD, умеет генерировать звук, особенно хорошо — речь. T2A-01-HD может создавать синтетический голос с разными темпом, тональностью и высотой на 17 языках, включая английский и китайский, а также клонировать голос всего по 10 секундам записи. MiniMax не опубликовала результаты тестов, сравнивающих T2A-01-HD с другими аудиомоделями. Но, по данным TechCrunch, качество звука T2A-01-HD не уступает инструментам от Meta (организация признана экстремистской и запрещена в РФ) и таких стартапов, как PlayAI.
Все новые модели MiniMax, кроме T2A-01-HD, которая доступна только через API MiniMax и платформу Hailuo AI, можно скачать с GitHub и платформы для разработчиков Hugging Face.
Однако модели нельзя назвать в полной мере открытыми, так как MiniMax не опубликовала данные для обучения и использует лицензию с ограничениями.
MiniMax, основанная в 2021 году бывшими сотрудниками одной из крупнейших ИИ-компаний Китая SenseTime, разрабатывает различные ИИ-платформы, включая сервис чат-ботов Talkie и модели преобразования текста в видео. Однако некоторые продукты MiniMax вызвали споры. Talkie был удален из App Store из-за использования ИИ-аватаров публичных фигур без их согласия. Видеогенераторы MiniMax обвинялись в воспроизведении логотипов британских телеканалов и незаконном использовании защищенных авторским правом записей iQiyi.
MiniMax представила новые модели спустя несколько дней после предложения администрации Байдена ужесточить экспортные правила для технологий ИИ в Китай. Ранее китайским компаниям уже запретили закупать передовые ИИ-чипы, а новые меры могут усилить ограничения как на полупроводники, так и на модели для сложных ИИ-систем.