Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)

27.02.2025 14:48

Habr.com

Всем привет! Меня зовут Александр Тюрин, я руководитель группы «Методы оптимизации в машинном обучении» в AIRI и старший преподаватель Сколтеха. Мы с коллегами занимается оптимизацией распределённого обучения — это довольно актуальная проблема, учитывая, что современные модели обучаются на многих тысячах GPU.

За последние 2 года нам удалось сделать несколько открытий в асинхронных методах оптимизации, которые мы изложили в 5 статьях [1–5] на NeurIPS и ICLR. В этой статье я расскажу, в чём заключаются особенности распределённого обучения и что нового привнесли в него мы с точки зрения теории.

Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)

Новости спорта

Три теннисиста из топ-20 ATP снялись с турнира в Акапулько из-за пищевого отравления

В Подмосковье помощник машиниста склонял несовершеннолетнюю к зацепингу

Владимир Путин высоко оценил подвиг Героя России Андрея Григорьева

Названа возможная причина смерти актрисы Мишель Трахтенберг

"Зенит" выбирают почти 20 млн болельщиков по всей России