Когда Иннокентий Смоктуновский «снимется» в «Игре престолов»
В мире не утихают споры об опасности искусственного интеллекта. Алгоритмы лишают людей рабочих мест, без спроса собирают персональные данные и наводняют интернет фальшивым контентом. В то же время умение анализировать информацию и искать в ней неочевидные закономерности уже стало одним из ключевых навыков XXI века. Россия в этой сфере пытается не отставать от мировых трендов. Несмотря на часто неуклюжие попытки властей регулировать новые технологии, здесь есть сильные разработчики и крупные IT-компании. Яркий пример — «Яндекс», который давно перестал быть «просто поисковиком» и превратился в сложную цифровую экосистему. «Новая» обсудила с руководителем Лаборатории машинного интеллекта «Яндекса» Александром Крайновым основные вызовы, связанные с нейросетями нового поколения.
— В последние годы IT-компании захватывают одну отрасль экономики за другой. «Яндекс», например, выстроил целую экосистему из самых разнообразных сервисов: финансы, доставка еды, транспорт, музыка, «умный дом», голосовой помощник, новостные агрегаторы... Не закончится ли эта экспансия полным доминированием технологических компаний?
— Все сферы IT-компании точно не заполнят. Я не представляю, например, как мы бы пошли добывать нефть. Просто есть ряд индустрий, в которых меняется место, где можно создавать добавленную стоимость. Например, мы собрали большое количество музыки и дали людям доступ к ней. Выигрывать конкуренцию в такой ситуации начинает тот, кто делает самые эффективные рекомендательные системы, построенные на базе машинного обучения. Или взять беспилотный автомобиль: он поездит, а потом приезжает и заливает собранные данные на серверы.
Один автомобиль собирает примерно 1 гигабайт в минуту — представляете, какие это объемы данных? Надо уметь их хранить, обрабатывать, анализировать — это сложное умение, которое не берется из ниоткуда.
Получается, что лидерство здесь у тех, кто разрабатывает наиболее функциональные системы управления беспилотниками. При этом «Яндекс» не делает собственные автомобили, мы создаем только программное обеспечение и предлагаем его производителям, как в случае с Hyundai.
Если поговорить с банками, то все они сейчас говорят: «Мы не финансовые, а IT-компании». Я общался с людьми, которые делают пиццу, и они говорят то же самое: наш основной навык — это алгоритмы доставок, кулинарная часть здесь не столь важна. Но все равно остается граница, которую IT-компании не переходят. И определяется она очень просто: там, где конкурентное преимущество — это умение работать с данными, побеждают IT-компании, а там, где надо что-то производить — закручивать гайки, сверлить, бурить, побеждают все остальные.
— Вам не кажется, что эта тенденция увеличивает риски монополизации? Все сервисные услуги по факту могут оказывать несколько крупных интернет-компаний.
— Скажем так, наша позиция состоит в том, что мы за конкуренцию и равные возможности для всех. Правильно и здорово, если государство следит за тем, чтобы никто не злоупотреблял своим положением на рынке. Это означает, что никакие административные запреты не нужны, конкуренция прекрасно развивает качество сервиса. Если сравнить качество поиска в России и в некоторых других странах, можно заметить, что у нас оно сильно выше. Когда у компании 99 % рынка, она не заинтересована в улучшении. В России совсем не так. Сейчас ситуация хорошая, надеюсь, она такой и останется.
— В мире ведь достаточно мало стран, в которых до сих пор существует свой национальный поисковик?
— Россия, Китай, Южная Корея, США — все, больше нигде в мире нет своих поисковиков.
— А с чем это связано?
— В каждой конкретной стране это связано с наличием в ней конкурентоспособной компании. В России есть «Яндекс» и его замечательные разработчики, которые поддерживают качество сервиса на высоком уровне. Если говорить про Южную Корею, то там есть очень высокотехнологичная компания Naver, ориентированная на локальный рынок. Мы смотрим на китайский поисковик Baidu и видим, что там высочайшее качество поиска, это абсолютно конкурентоспособный сервис, даже если убрать все административные препятствия для иностранных сервисов.
В Китае вообще очень сильна локальная конкуренция: чуть расслабишься — тут же придут другие, даже если у тебя сейчас 90 % рынка. В США идет давняя битва между Bing от Microsoft и Google, качество сервиса тоже очень высокое. А вот в других местах локальные игроки проигрывают. Я с грустью смотрю, как в Чехии постоянно деградирует местный поисковик, у которого раньше была высокая доля рынка, а сейчас меньше 10 %. Хотя чехи любят свой поисковик, они все больше пользуются Google.
— Сейчас много говорят о фрагментации интернета, его дроблении на отдельные сегменты. Из опросов видно, что новые поколения пользователей часто воспринимают платформы (Facebook, Google, Wikipedia) обособленно, а не как часть Всемирной сети. Нет ли здесь угрозы, что мы окажемся заперты в герметичных экосистемах нескольких крупных корпораций?
— Мне кажется, что об этих тенденциях говорят с момента появления интернета. Я такой проблемы не вижу: информационная связность постоянно повышается. Да, вспухают локальные сервисы и сообщества, живут какое-то время, но быстро растворяются. Если говорить про ощущения людей, то они иногда думают, что интернет — это браузер или поисковая система. Эти понятия часто путаются, поскольку базовая грамотность не очень высокая. Но нет такого, что одна среда никак не пересекается с другой. Может быть, в случае соцсетей это в какой-то степени так, но у людей часто бывают аккаунты в разных соцсетях. А если какие-то сервисы начинают разделяться слишком сильно, то появится третий сервис, который объединит первые два. Другое дело, что иногда случается, что на рынке появляется монополист и начинает диктовать свои условия, но в этой ситуации должны брать слово антимонопольные комитеты.
«Отличить настоящее видео от созданного нейросетью будет невозможно»
— В последние месяцы самые громкие новости вокруг искусственного интеллекта связаны с технологией DeepFake, которая позволяет создавать фейковые фото и видео. В Китае существует целый теневой рынок таких услуг: можно, например, вставить лицо любого человека в ролик эротического содержания. Даже российское приложение FaceApp с состаривающим фильтром для фотографий, внешне довольно безобидное, привлекло внимание американского конгресса. Что это за технология и почему она вызывает столько шума?
— Одно из самых ярких открытий в обучении нейросетей за последние пять лет — это так называемые генеративно-состязательные нейросети. Идея такая: есть две нейросети, одна из который контент создает, а другая пытается отличить настоящий контент от созданного нейросетью. Если создающая контент нейросеть не смогла обмануть проверяющую нейросеть, то ей дается обратная связь о том, что нужно делать как-то по-другому, потому что так ее легко раскусить. Если проверяющая нейросеть ошибается, то ей тоже дается обратная связь. Так, соревнуясь и обучая друг друга, нейросети доходят до очень приличного уровня.
И вот в результате нейросети научились создавать изображения, неотличимые от настоящих. Здесь важно дать определение термину «настоящее». Если мы говорим про живопись, это значит то, что мог бы создать настоящий художник. Если про фотографию, то она должна быть неотличима от реальной фотографии, то есть достигается максимальный фотореализм. Что происходит дальше? С одной стороны, нейросеть начинает работать все лучше и лучше, с другой стороны, процесс происходит все быстрее: контент создается не за полчаса на сервере, а мгновенно и прямо на вашем телефоне. И, разумеется, спектр применения этой технологии самый широкий.
Есть игровые и развлекательные истории, как с FaceApp. История с фотожабами довольно давняя, просто раньше для этого нужен был Photoshop. А теперь ты берешь лицо, и нейросеть вставляет его куда угодно. Надо понимать, что эти картинки — это не то, как человек будет выглядеть в старости, это лишь один из вариантов, которых существует бесконечное множество. Но при этом довольно реалистичный вариант.
Эта технология будет стремительно расти, развиваться, что приведет к значительным изменениям в кино. Например, мы увидим синтезированных актеров, которых никогда не существовало в реальности. Это особенно критично для продюсеров, ведь сейчас бывает так, что актер может отказаться от дальнейшей съемки и тем создать большие проблемы, а с нейросетью такой проблемы не будет.
В какой-то момент времени пользователь сможет сам решать, кто должен играть в фильме. Можно будет собрать свой актерский состав. Например, интересно, как бы Иннокентий Смоктуновский сыграл в «Игре престолов».
Конечно, встает вопрос, насколько можно будет доверять видео с доказательной точки зрения. Наверное, уровень доверия сильно пострадает, потому что качество синтеза будет обгонять технологии, позволяющие отличать подделки. Все это дойдет до такого уровня, что отличить настоящее видео будет невозможно, и мы перестанем доверять фотографиям и видео как чему-то авторитетному. В течение переходного периода общество, скорее всего, будут сотрясать скандалы, потому что не все люди еще поняли, что происходит. Но со временем к новой реальности мы привыкнем.
Что говорить о менее этичных сервисах для взрослых. В этот сегмент тоже приходят высокие технологии, но чуть медленнее, потому что ни одна большая компания высокотехнологичная не захочет портить свою репутацию и идти в эту область. Но, как ни крути, технология появилась и становится все доступнее, и области ее применения растут.
— Это происходит и с другими формами информации. Есть нейросети, которые умеют генерировать связный текст практически на любую тему, и они считаются идеальным инструментом для создания fake news.
— К текстам доверия нет уже давно, с созданием fake news неплохо справляются и люди. Умение нейросетей осознанно вести диалог существует: у нас есть Алиса, которая общается с пользователями. Это выглядит абсолютно естественно, даже если пользователь знает, что это бот. Что касается генерации текстов машиной, это тоже проблема не новая. Например, в поисковой выдаче важно показывать контент, который создан именно людьми, а не роботами. Есть большое количество вебсайтов, даже, наверное, большинство, которые генерируются автоматически, хотя выглядят как настоящие. И есть отзывы, которые пишут роботы. Такие отзывы мы стараемся детектировать и не учитывать. Появляются все более совершенные методы машинного обучения, которые позволяют это обнаруживать. Но и те, кто создает такие сайты, тоже на месте не стоят. У них тоже развиваются алгоритмы. Эта борьба идет уже больше 10 лет и будет продолжаться и дальше.
— Кроме проблемы фейков, есть страх того, что приложения вроде FaceApp недобросовестно используют пользовательские данные. Что чисто теоретически можно сделать с миллионами загруженных фотографий пользователей — тренировать на них нейросети, продавать другим компаниям?