Меня довольно сильно интересует тема распределенного обучения ML моделей и в свободное время стараюсь изучать материалы, связанные с этой темой. Материалов не так уж и много, на самом деле, поэтому любая новая публиках на эту тему привлекает внимание. И 16 декабря в блоге Google AI был опубликован новый пост на эту тему, в котором авторы описывают новый подход в Федеративному обучения и я решил перевести его на русский язык, наедаясь, что кому нибудь этот материал так же может показаться интересным.
Для тех, кто не сильно знаком с этом темой, хочется сделать несколько вводных пояснений. Federated Learning (далее FL для сокращения) (так называется совокупность методов обучения ML моделей на распределённых данных) в общем то изначально дразнится Google и поддерживается в наборе инструментов TensorFlow. Почему именно Google? Дело в том, что FL решает следующую проблему: в стандартных подходах ML все базируется на том, что все данные, необходимые для обучения, доступны в рамках единого пространства памяти (централизованы на одном сервере/кластере), но есть много случаем, когда по соображениям конфиденциальности (связанными как с коммерческой тайной, так и с вопросами privacy и защиты пользовательских данных) мы не может все данные скопировать в единое хранилище. Вот FL и предлагает различные методики обучения, которые позволяют натренировать модель без централизации данных. Google с этой проблематикой сталкивается потому что является разработчиком мобильной операционной системы Android, многие функции которой требуют применения ML подходов. В частности, у них есть приложение GBoard - это мобильная клавиатура, которая подсказывает пользователю следующее слово в набираемой фразе, тем самым позволяя экономить время пользователю при наборе текста. Для того, что бы натренировать предсказательную модель, требуется обработка текстов, которые пользователи вводят в рамках переписки в мессенджерах и тп, и тут как раз и возникает проблема работы с приватными данными. Поэтому надо еще раз подчеркнуть, что текст ниже и прочие публикации Google на эту тему следует воспринимать в контексте именно этой проблематики, хотя подобные методы можно применять и в большом количестве других кейсов.
Brütal Legend is free in honor of Ozzy Osbourne, but only for 666 minutes
'I destroyed months of your work in seconds' says AI coding tool after deleting a devs entire database during a code freeze: 'I panicked instead of thinking'
Microsoft warns of 'active attacks' on its government and business server tech, with one cybersecurity expert claiming that they should 'assume that you have been compromised'
Краткая биографическая справка о центральных персонажах Mafia: The Old Country
Сергей Карякин: **23 июля открыл свой Шахматный клуб на базе московского Единого центра поддержки участников специальной военной операции и членов их семей!
Еще одно здание ГБУ «Жилищник» появится во Внукове
Девушка Рая отреагировала на использование ее лица во время выступления Элджея
История СССР в объективе легендарного Дмитрия Бальтерманца
Еще одно здание ГБУ «Жилищник» появится во Внукове
Сергей Карякин: **23 июля открыл свой Шахматный клуб на базе московского Единого центра поддержки участников специальной военной операции и членов их семей!
Врач Щетинина: натуральные соки могут навредить здоровью пожилых
Девушка Рая отреагировала на использование ее лица во время выступления Элджея
Врач Щетинина: натуральные соки могут навредить здоровью пожилых
Ветеринары напомнили жителям Подмосковья о необходимости вакцинации питомцев
Сергей Карякин: **23 июля открыл свой Шахматный клуб на базе московского Единого центра поддержки участников специальной военной операции и членов их семей!
Адвокат Грачева заявила, что Седокову хотят привлечь к уголовной ответственности