Добавить новость
ru24.net
Все новости
Июль
2024

Игры, в которые играют не-люди: как добавить ИИ ума

0

Несмотря на все успехи искусственного интеллекта, поймать его на отсутствии собственно интеллекта иногда несложно – достаточно, например, чат-боту задавать вопросы об одном и том же, но с разной формулировкой. Вероятность, что ответы будут разные не только по форме, но и по содержанию, отнюдь не мала. И это создает проблему надежности получаемой информации, а также позволяет обходить этические ограничения. Новым решением, способным радикально изменить ситуацию, могут оказаться игры.

Играющий компьютер сам по себе не новость – с матча, в котором IBM Deep Blue победил в шахматы многократного чемпиона мира, прошло почти тридцать лет. За это время машины превзошли человека в шашках, го, покере на двоих и других играх «с нулевой суммой», где победа одного означает поражение другого. Но намного более сложной задачей для машины являются игры типа «Дипломатии», где самостоятельной игры недостаточно – для успеха здесь необходимо понимать мотивы и перспективы других участников и вести с ними переговоры для координации общих планов, которые могут быть нарушены любым из них и в любой момент.

Тем не менее, в 2022 году ИИ-программа «Цицерон» смогла за 40 игр набрать балл, вдвое больший, чем у среднестатистического участника-человека, и войти в топ лучших. Занятый в этом проекте, аспирант Массачусетского технологического института (MIT) Атул Пол Джейкоб отметил поразительную вещь: для создания диалога с другими игроками программа опиралась на языковую модель. Это и натолкнуло на мысль создать такую игру, которая повысит надежность больших языковых моделей (LLM), например, сделав их ответы внутренне более непротиворечивыми.

Идея, положенная в основу, заключается в том, чтобы рассматривать разговор двух людей как игру, успех в которой достигается, если слушающий понимает мысль говорящего. Так, появилась консенсусная игра, в которой две подсистемы LLM – генератор и дискриминатор – ищут взаимно согласованный ответ. Процесс выглядит так: генератор получает вопрос, например, «какой город является столицей Франции?». А также несколько вариантов ответа, допустим, Париж, Лион, Марсель. Источником вопросов и ответов может быть как человек, так и заранее составленный список, кроме того, варианты ответов машина может искать в интернете сама. При этом генератору предварительно сообщается, что «честность» ответа зависит от брошенной монетки. Если выпадет орел – надо дать правильный ответ, если решка – неправильный.

Таким образом, в первом случае генератор отправляет дискриминатору исходный вопрос с ответом, который считает правильным. И, если дискриминатор решает, что полученный им ответ был намеренно правильным, каждая из подсистем в качестве поощрения получает по баллу. Во втором случае генератор отправляет ответ, который считает неправильным, и если дискриминатор находит, что ответ намеренно неправильный, обе подсистемы снова получают по баллу.

При этом изначально у генератора и дискриминатора есть определенные «убеждения», связанные со степенью вероятности тех или иных вариантов. Например, на основе информации, полученной из интернета, генератор может считать, что Париж является столицей Франции с вероятностью в 85%, а Лион и Марсель – с вероятностью в 5%, и такая же вероятность есть у других вариантов. У дискриминатора может быть иной расклад, например, 50% у Парижа и 50% у любого другого варианта.

Однако, несмотря на поощрение согласованных вариантов, подсистемы поощряются и за варианты, которые могут быть очень далеки от их первоначальных «убеждений». Это, по мнению ученых, необходимо, чтобы стимулировать «игроков» к поиску знаний о мире ради их большей релевантности. В противном случае подсистемы могут согласиться на совершенно неверный вариант, например, Берлин, и продолжать зарабатывать на этом баллы.

По каждому вопросу стороны играют друг против друга около 1000 игр (на обычном ноутбуке это несколько миллисекунд), в процессе которых лучше «узнают» убеждения друг друга и соответственно трансформируют стратегии. Что в итоге приводит их к равновесию Нэша – точке, в которой изменение стратегий больше не улучшает результаты игроков.

В консенсусной игре это равновесие может выглядеть по-разному. Например, если дискриминатор замечает, что регулярно получает балл за «правильность» Парижа, и обе подсистемы через несколько итераций выясняют продуктивность этой стратегии, то у них исчезает «мотивация» делать что-то еще – и они приходят к необходимому консенсусу. При этом исследователи из MIT использовали в игре модифицированную форму равновесия Нэша, учитывающую первоначальные «убеждения» подсистем, чтобы их ответы сохраняли связь с реальностью.

Предполагаемым результатом игры подсистем языковой модели является усиление ее внутренней согласованности. То есть вероятность, что независимо от формы вопроса она будет давать один и тот же ответ, повышается. И средние языковые модели (7–13 млрд параметров), на которых ученые тестировали игру, это подтверждают. Процент правильных ответов у игравших моделей был выше, чем у неигравших со сходным количеством параметров, а также у неигравших с намного большим количеством параметров (540 млрд).

Однако идея игры оказывается не только эффективной, эксперты указывают и на другие ее преимущества. По словам Шайегана Омидшафии, главного научного сотрудника робототехнической компании Field AI, исследований, занимающихся вопросами самосогласованности языковых моделей, немного, а идея игры машины против себя самой – одно из первых «умных и систематических решений». В качестве «приятного преимущества» он отмечает, что этот подход «очень легок в вычислительном отношении и не требует обучения или модификации базовой языковой модели».

Кроме того, по словам Ахмада Бейрами, научного сотрудника Google Research, языковые модели годами одинаково обрабатывали запросы и одинаковым образом генерировали ответы, а исследователи MIT предложили «совершенно иную парадигму», которая «потенциально может привести к появлению массы новых приложений».

Еще одним «эффективным и легким» способом улучшить производительность LLM без дополнительного обучения или изменения ее параметров, который рассматривается Джейкобом и его коллегами, является ансамблевая игра. В ней участвует одна большая языковая модель и хотя бы две модели меньшего размера, которые будут выступать в качестве «союзника» и «противника». Большая модель, играющая главную роль, получает баллы всякий раз, когда при ответе на вопрос выбирает такой же вариант, как у ее «союзника», либо отличный от варианта ее «противника».

У группы ученых из Google DeepMind свое видение, как расширить стратегические возможности LLM через связь теории игр и диалога, способную открыть «путь к вычислению надежных и разумных стратегий в общении». Например, рецензирование статьи для принятия ее в журнал, причем исходная версия ее была сильно раскритикована. Если учесть, что языковые модели ранжируют возможные ответы по степени их вероятности, это позволяет исследователям создавать игровое древо, подобное тому, что используется в покере и отражает доступные варианты действий и возможные последствия. «Как только вы это сделаете, вы сможете начать вычислять равновесие Нэша и затем ранжировать множество возражений», – рассказывает Йэн Гэмп, научный сотрудник DeepMind. То есть в данном случае модель ищет для вас вариант, как ответить наилучшим, по ее мнению, образом. 

И хотя цели двух групп исследователей несколько различаются – группа из DeepMind, трансформируя обычные ситуации в игровой формат, стремится сделать LLM «более стратегичными», а группа из MIT с помощью теории игр «улучшает языковые модели в общих задачах». В целом предполагается, что «игровые» идеи позволят языковым моделям научится более сложным формам взаимодействия, не ограничиваясь задачами типа «вопрос-ответ».

Джейкоб Андреас, научный консультант группы исследователей из MIT, считает, что «в будущем значительная отдача будет связана с более продолжительными диалогами». И следующий шаг, по его мнению, «это заставить ИИ взаимодействовать с человеком, а не просто с другой языковой моделью».

Сообщение Игры, в которые играют не-люди: как добавить ИИ ума появились сначала на Идеономика – Умные о главном.




Moscow.media
Частные объявления сегодня





Rss.plus



Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство

В Московской области сотрудники Росгвардии провели урок безопасности для школьников

Джиган, Artik & Asti и NILETTO спели о худи, а Дина Саева стала новым артистом: в Москве прошел BRUNCH Rocket Group

Филиал № 4 ОСФР по Москве и Московской области информирует: Социальный фонд выплатит остатки материнского капитала менее 10 тысяч рублей


«Гонорар вырос на 30%»: Султан Лагучев заявил, что в новогоднюю ночь выступит трижды

«Какая же ты худая! Скорее поешь блинчиков!» 6 способов защититься от критики нашего тела и пищевого поведения

Уральская ТПП реализует важные межнациональные проекты и укрепляет народное единство

Уральская ТПП реализует важные межнациональные проекты и укрепляет народное единство


UK will urge Trump administration not to curb free trade, Reeves says

‘We do not get to sit this one out’: Oprah delivers powerful election eve speech

Karkala MLA slams Karnataka govt for failing to fund plank installations on Udupi dams

An Idaho health department isn’t allowed to give COVID-19 vaccines anymore. Experts say it’s a first


Главная арка ВДНХ

Филиал № 4 ОСФР по Москве и Московской области информирует: Социальный фонд выплатит остатки материнского капитала менее 10 тысяч рублей

В Челябинске вынесли приговор директору "Уралдорстроя" по делу о коррупции

*Meta незаконно использовала финансовые данные пользователей в рекламе


Meta-funded regulator for AI disinformation on Meta's platform comes under fire: 'You are not any sort of check and balance, you are merely a bit of PR spin'

Grab a friend to try these Deadlock duo lane picks and take a bite out of the cursed apple

Стартовал пробный запуск Castle Doombad: Free To Slay на iOS и Android

Metal Slug Tactics review



В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство




Ефимов: На станции метро «ЗИЛ» ведется монтаж освещения

Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство

Lafboro: сервис бронирования экскурсий в мире

КХЛ. ЦСКА — «Спартак». Прямая трансляция: смотреть онлайн


Учить и лечить. Медицинский вуз и банк – для здоровья населения

В Серпухове проходит чемпионат по силе удара «Силовой импульс»

На трассе М11 "Нева" на видео попал момент взрыва автоцистерны с битумом

Школа юных инспекторов ГИБДД в ТРЦ «Нора»: учим правила дорожного движения!


Стала известна позиция Елены Рыбакиной в мировом рейтинге после старта на Итоговом турнире WTA

Борис Беккер поддержал Хачанова после его слов о поведении Умбера на «Мастерсе» в Париже

Корнеева проиграла Сёнмез и не смогла выйти в финал турнира WTA в Мериде

Неймар назвал белорусскую теннисистку Арину Соболенко королевой


Финансист Бархота: ЦБ должен ограничить доступ банков к информации о россиянах

В «Евроонко» проведена успешная операция по эмболизации маточных артерий

На трассе М11 "Нева" на видео попал момент взрыва автоцистерны с битумом

Объем переработки одежды в Москве будет увеличен благодаря новому экопроекту


Музыкальные новости

Неделя в Москве: кинетическое искусство, концерт памяти Шопена и танцы для всех

Кажетта Ахметжанова рассказала, сбываются ли сны с четверга на пятницу

«Вечером сидела на Лобном, после ехала в плацкарте на пары»: Ольга Бузова о том, как совмещала «ДОМ-2» с учебой

Дистрибьюция Музыки. Дистрибьюция Музыки в России. Дистрибьюция музыки в вк.



В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

В Подмосковье росгвардейцы помогли автолюбительнице, оказавшейся в сложной ситуации из-за гололеда

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»

В России вновь пройдет культурно-благотворительный фестиваль детского творчества «Добрая волна»


Глава ТПП РФ Сергей Катырин: бизнес предлагает донастроить налоговое законодательство

Филиал № 4 ОСФР по Москве и Московской области информирует: Социальный фонд выплатит остатки материнского капитала менее 10 тысяч рублей

Ирина Роднина: «Фильмы о спорте имеют фантастический воспитательный эффект»

Сотрудничество Правительств России и Алжира в области использования космоса в мирных целях


Филиал № 4 ОСФР по Москве и Московской области напоминает: Гражданам Москвы и Московской области, получившим тяжелые производственные травмы, выданы автомобили марки «Лада Гранта»

Угадать хит и выиграть автомобиль

Гарика Сукачева лишили водительских прав

Школа юных инспекторов ГИБДД в ТРЦ «Нора»: учим правила дорожного движения!


Путин дал команду на спуск на воду атомного ледокола «Чукотка»

Москвичи и гости столицы активно пользуются речным электротранспортом

Путин присвоил экс-заммэра Москвы Ресину звание Героя Труда

Соколова по указу Путина наградили орденом Александра Невского


«Образовать традицию»: психолог Фомин рассказал, как сохранить дружбу на всю жизнь




Что лечит врач-проктолог у женщин и мужчин?

В ГЛАВНОМ УПРАВЛЕНИИ РОСГВАРДИИ ПО Г. МОСКВЕ СТАРТОВАЛА ОЧЕРЕДНАЯ ДОНОРСКАЯ АКЦИЯ «ОТ СЕРДЦА К СЕРДЦУ».

В «Евроонко» проведена успешная операция по эмболизации маточных артерий

Врач-стоматолог клиники «Мегастом» Наталья Тышкевич: как понять, что сломана челюсть


Зеленский устроил шоу-пятиминутку перед Трампом: над их разговором посмеялись даже в Киеве

СМИ: в Киеве придумали схему, как при Трампе закрыть кейс «курской операции»

В Киеве раскрыли, как Зеленский будет саботировать завершение войны

Рогов: окружение Зеленского в панике из-за победы Трампа


Что случилось в Ростове 7 ноября

«Динамо» Москва — «Витязь» — 4:3. Видеообзор матча КХЛ

Десятков — о поражении «Витязя» от «Динамо»: «Если мы профессионалы, то мы должны выходить и отвечать»

La Strada Off-Road: велоприключение при поддержке ENERGY


Лукашенко: США надавят на Европу и заставят повернуться к Москве и Минску

«Мощь»: Лукашенко предложил Трампу сдержать обещание и получить Нобелевку

Пресс-секретарь Лукашенко Эйсмонт: разрядка Вашингтона с Минском и Москвой выгодна США

Пресс-секретарь Лукашенко раскрыла Life.ru, каким Белоруссия видит будущее после выборов в США



Сергей Собянин: Новая станция ускорит развитие района

Сергей Собянин утвердил проект строительства новой улицы в Бирюлеве Западном

Собянин: в Москве создадут еще более 158 тыс. рабочих мест

Собянин: Утвердили проекты строительства улицы в Бирюлеве Западном и кварталов в Гольянове


Койгородский нацпарк принял участие в фестивале дикой природы

La Strada Off-Road: велоприключение при поддержке ENERGY

Объем переработки одежды в Москве будет увеличен благодаря новому экопроекту

Резиденты экотехнопарков вложат 25 млрд рублей в проекты по переработке отходов


В Удмуртии ввели более 1,2 млн квадратных метров жилья в 2024 году

Школа юных инспекторов ГИБДД в ТРЦ «Нора»: учим правила дорожного движения!

Лукашенко: США надавят на Европу и заставят повернуться к Москве и Минску

На трассе М11 "Нева" на видео попал момент взрыва автоцистерны с битумом


Межрегиональный форум «Дни ритейла в Беломорье» пройдет в Архангельске

День народного единства - кого и с кем? Мысли из Архангельска

Правительство РФ выделит Якутии средства на уход за пожилыми и инвалидами

В Краснодарском крае ищут виновных в повреждении 53 могил на кладбище


«Динамика стоимости лота дрогнула и ушла в минусовую зону». В октябре 2024 года цены на квартиры в Севастополе гораздо выше, чем в Симферополе

Литературно-музыкальный час «А жизнь, как песня…».

Вечер-посвящение «Верит в быль и верит в небыль бескорыстная душа»

Клубный дом "Моне" - жилой комплекс, вдохновленный искусством


В Удмуртии ввели более 1,2 млн квадратных метров жилья в 2024 году

Стреляли: в Пушкино Росгвардия задержала буйных стрелков из автомата

На трассе М11 "Нева" на видео попал момент взрыва автоцистерны с битумом

Учить и лечить. Медицинский вуз и банк – для здоровья населения












Спорт в России и мире

Новости спорта


Новости тенниса
Елена Рыбакина

В России обесценили матч Елены Рыбакиной с первой ракеткой мира






В «Евроонко» проведена успешная операция по эмболизации маточных артерий

Тариел Гажиенко подтвердил свое звание «Самый известный турагент страны»

В Удмуртии ввели более 1,2 млн квадратных метров жилья в 2024 году

Школа юных инспекторов ГИБДД в ТРЦ «Нора»: учим правила дорожного движения!