Математики обучили конкурента OpenAI o1 за 26 минут и $50
Процесс обучения модели s1 включал несколько этапов. Вначале ученые выбрали в качестве основы Qwen2.5 — открытую модель от Alibaba Cloud. Затем они подготовили набор данных из 59 000 вопросов, но после экспериментов выяснили, что использование всего 1000 вопросов дает аналогичную точность, при этом сокращая время и стоимость обучения.
Для оптимизации процесса исследователи применили метод дистилляции. Этот подход позволяет меньшим моделям перенимать знания от более мощных систем, обобщая их ответы. В данном случае s1 обучали, используя результаты вычислений модели Gemini 2.0 Flash Thinking Experimental от Google. Таким образом, s1 формировала собственные алгоритмы рассуждений на основе логики, заложенной в более мощном ИИ.
Обучение проводилось на 16 графических процессорах Nvidia H100, что позволило существенно сократить время обработки данных. Кроме того, модель использует технику test-time scaling, благодаря которой система способна удлинять процесс анализа перед выдачей ответа. Исследователи добавляли команду «Подождать» в ответы, чтобы s1 перепроверяла свои рассуждения, что значительно повысило точность решений.
Согласно опубликованным данным, s1 превосходит модель OpenAI o1-preview на 27% при решении математических задач. При этом ее обучение обошлось в десятки тысяч раз дешевле, чем у крупных компаний, таких как OpenAI и Google.
Использование чужих моделей для обучения конкурентов вызывает споры. В 2023 году OpenAI обвинила компанию DeepSeek в незаконном заимствовании данных для создания аналогичной модели R1. В условиях использования API Gemini прямо запрещено применение этой технологии для создания конкурирующих ИИ.
Рост доступных и эффективных моделей меняет рынок искусственного интеллекта. Теперь небольшие исследовательские группы могут разрабатывать мощные системы без значительных вложений в инфраструктуру. Это ставит под сомнение необходимость гигантских дата-центров с тысячами видеокарт.
Google пока не прокомментировала эксперимент с s1. Если технологические гиганты не смогут защитить свои разработки от дистилляции, стоимость ИИ-решений может резко снизиться, что приведет к изменению структуры индустрии.