Добавить новость
ru24.net
Блог сайта «Хайтек+»
Январь
2025
1
2
3
4
5
6
7
8 9 10
11
12 13 14 15 16 17
18
19 20 21 22 23 24
25
26 27 28 29 30 31

Китайская ИИ-модель Kimi k1.5 освоила рассуждения и превзошла OpenAI o1

Одной из ключевых особенностей Kimi k1.5 является возможность обрабатывать контекстные окна до 128 тысяч токенов. Это позволяет модели работать с объемом данных, равным большому роману — поместится почти вся "Война и мир" Толстого (в произведении около 172 тыс. токенов). Модель решает сложные задачи, например, планирует и корректирует свои шаги при решении математических примеров, что напоминает процесс рассуждения человека.

Kimi k1.5 представлена в двух версиях: для детального рассуждения (long-CoT) и для кратких ответов (short-CoT). Оба варианта показывают результаты, которые соответствуют или превосходят производительность таких моделей, как GPT-4o и Claude 3.5 Sonnet. В частности, версия long-CoT превосходит OpenAI o1 в некоторых тестах, а short-CoT обгоняет Claude 3.5 Sonnet. Это стало возможным благодаря улучшению подхода к обучению и обработке информации.

Результаты версии long-CoT в тестах на знание математики, программирование, распознание визуальной информации и решение общих задач.

Результаты версии short-CoT.

Компания Moonshot AI использовала инновационные методы обучения для улучшения производительности модели. Вместо традиционных подходов, таких как поиск по дереву Монте-Карло, была выбрана упрощённая система обучения с подкреплением. Команда сосредоточилась на конечном результате, что дало модели больше свободы для поиска путей к правильному ответу. Кроме того, были внедрены штрафы за слишком длинные ответы, чтобы модель не делала лишние шаги и не расходовала ресурсы зря.

В процессе разработки также применялись методы слияния моделей и "Shortest Rejection Sampling". Это позволило Kimi k1.5 выбирать наиболее краткие и точные ответы. В исследовании также было установлено, что увеличение длины контекста в рамках до 128 тыс. токенов повышает точность решений, позволяя моделям проводить более сложные рассуждения.

Kimi k1.5 также показывает отличные https://the-decoder.com/chinese-openai-o1-challenger-kimi-k1... в мультимодальных тестах, таких как MathVista, где точность модели составила 74,9%. Это стало возможным благодаря способности модели анализировать как текст, так и изображения, что даёт ей возможность решать задачи на основе чертежей, диаграмм, таблиц и другой визуальной информации. Из-за этого она обгоняет OpenAI o1 как в геометрии, так и в программировании.

Kimi k1.5 уже доступна всем пользователям через платформу https://kimi.ai/ бесплатно. Эта модель может работать на английском языке, хотя компания продолжает дорабатывать языковую поддержку.

С момента своего запуска Kimi k1.5 привлекла внимание не только специалистов, но и инвесторов. В 2024 году Moonshot AI привлекла более $1 млрд в рамках раунда финансирования, и её оценка достигла $3,3 млрд к августу того же года. Это свидетельствует о растущем интересе к китайским ИИ-разработкам и их потенциалу на мировом рынке. Напоминаем, что недавно https://hightech.plus/2025/01/28/kitaiskii-startap-deepseek-... на $1 триллион.




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Анна Курникова

Названа причина, по которой Анна Курникова появилась на публике в инвалидном кресле






Суд прокомментировал действия банды амазонок, которые ранее орудовали на юге страны

Камень в желудке. Врач Пашаев: сколько хурмы может довести до больницы

Собянин: Число скачиваний приложения «Метро Москвы» превысило 16 млн

Раскрыты результаты работы первой в России «зеленой» электростанции