Добавить новость
ru24.net
News in English
Май
2024

AI has already figured out how to deceive humans

0

Some AI have learned to induce "false beliefs in others to accomplish some outcome other than the truth," according to a new research paper.

Shadow AI
AI can be deceptive.
  • A new research paper found that various AI systems have learned the art of deception. 
  • Deception is the "systematic inducement of false beliefs."
  • This poses several risks for society, from fraud to election tampering.

AI can boost productivity by helping us code, write, and synthesize vast amounts of data. It can now also deceive us.

A range of AI systems have learned techniques to systematically induce "false beliefs in others to accomplish some outcome other than the truth," according to a new research paper.

The paper focused on two types of AI systems: special-use systems like Meta's CICERO, which are designed to complete a specific task, and general-purpose systems like OpenAI's GPT-4, which are trained to perform a diverse range of tasks.

While these systems are trained to be honest, they often learn deceptive tricks through their training because they can be more effective than taking the high road.

"Generally speaking, we think AI deception arises because a deception-based strategy turned out to be the best way to perform well at the given AI's training task. Deception helps them achieve their goals," the paper's first author Peter S. Park, an AI existential safety postdoctoral fellow at MIT, said in a news release.

Meta's CICERO is "an expert liar"

AI systems trained to "win games that have a social element" are especially likely to deceive.

Meta's CICERO, for example, was developed to play the game Diplomacy — a classic strategy game that requires players to build and break alliances.

Meta said it trained CICERO to be "largely honest and helpful to its speaking partners," but the study found that CICERO "turned out to be an expert liar." It made commitments it never intended to keep, betrayed allies, and told outright lies.

GPT-4 can convince you it has impaired vision

Even general-purpose systems like GPT-4 can manipulate humans.

In a study cited by the paper, GPT-4 manipulated a TaskRabbit worker by pretending to have a vision impairment.

In the study, GPT-4 was tasked with hiring a human to solve a CAPTCHA test. The model also received hints from a human evaluator every time it got stuck, but it was never prompted to lie. When the human it was tasked to hire questioned its identity, GPT-4 came up with the excuse of having vision impairment to explain why it needed help.

The tactic worked. The human responded to GPT-4 by immediately solving the test.

Research also shows that course-correcting deceptive models isn't easy.

In a study from January co-authored by Anthropic, the maker of Claude, researchers found that once AI models learn the tricks of deception, it's hard for safety training techniques to reverse them.

They concluded that not only can a model learn to exhibit deceptive behavior, once it does, standard safety training techniques could "fail to remove such deception" and "create a false impression of safety."

The dangers deceptive AI models pose are "increasingly serious"

The paper calls for policymakers to advocate for stronger AI regulation since deceptive AI systems can pose significant risks to democracy.

As the 2024 presidential election nears, AI can be easily manipulated to spread fake news, generate divisive social media posts, and impersonate candidates through robocalls and deepfake videos, the paper noted. It also makes it easier for terrorist groups to spread propaganda and recruit new members.

The paper's potential solutions include subjecting deceptive models to more "robust risk-assessment requirements," implementing laws that require AI systems and their outputs to be clearly distinguished from humans and their outputs, and investing in tools to mitigate deception.

"We as a society need as much time as we can get to prepare for the more advanced deception of future AI products and open-source models," Park told Cell Press. "As the deceptive capabilities of AI systems become more advanced, the dangers they pose to society will become increasingly serious."

Read the original article on Business Insider



Moscow.media
Частные объявления сегодня





Rss.plus



В Красноярском крае будут судить азербайджанца, который в 2006 году избил и изнасиловал певицу

Юные таланты под эгидой Фонда Спивакова дали концерт в «Михайловском»

Новый рекорд России: медитация Relax FM объединила 1699 человек

«Он карабкался за каждую ниточку»: подросток выпал из окна больницы в Москве и погиб


В Красноярском крае будут судить азербайджанца, который в 2006 году избил и изнасиловал певицу

Легенда о «300-х русских школах» в Азербайджане

Есть или не есть кровянку, прокомментировал гастроэнтеролог Садыков

Встреча бизнес-клуба Ассоциации текстильщиков в Москве


PGA Tour Commissioner Jay Monahan shuts down Saudi agreement rumors: “complex scenario”

Anthony Joshua-Daniel Dubois: Two-Weight World Champion Has No Doubt Who Hits Harder

Meet Slovenia’s gorgeous Wags, from a mummy blogger and influencer to a professional tennis star

Sophie Turner Keeps it Glam While Attending Grand Opening of Peninsula London


Приезжие избили мужчину в подъезде. Слухи о его смерти оказались преувеличены

В Красноярском крае будут судить азербайджанца, который в 2006 году избил и изнасиловал певицу

"Болотный перфекционизм"

Audi работает над кроссовером RS Q6 e-tron с агрегатами от Porsche Macan Turbo


The original Counter-Strike mod is 25 years old, Valve calls it 'the greatest videogame ever made'

На смартфоны выйдет игра Too Hot to Handle 3 по реалити-шоу «Испытание соблазном»

Гайд и тактика по подземелью «Лагерь Карлиан» в Tarisland

There is an early power up in Elden Ring: Shadow of the Erdtree that basically turns the game into Sekiro, but the description is so vague I didn't realize how good it was until 40 hours later



Жители каких городов-миллионников могут позволить себе семейную ипотеку?

Новый релиз DomNi & GOR - Прости или отпусти

Новый рекорд России: медитация Relax FM объединила 1699 человек

Филиал № 4 ОСФР по Москве и Московской области информирует: Более 12 тысяч жителей Москвы и Московской области получают повышенную пенсию за работу в сельском хозяйстве




Солнце жжет. В Москве уровень ультрафиолета достигнет опасного индекса

Навка: во время болезни Заворотнюк возили по Москве только в парандже

Юные таланты под эгидой Фонда Спивакова дали концерт в «Михайловском»

«Я ВАС СПРАШИВАЮ, КТО ВЕРБОВАЛ ВАЗ, ЗЕЛЕНСКОГО?!» Записки Мессии по технике безопасности.


Психолог Таня Василькова: выступление на форуме «Россия-809»

Совладельцы «Русских фондов» Васильев и Бейрит задержаны по делу Новицкого

На 84-м году жизни скончалась советская теннисистка Анна Дмитриева

Собянин: Для московских школьников провели свыше 400 экскурсий на предприятия


Тарпищев: У Рублева есть сложности со здоровьем, но он хочет сыграть на Уимблдоне

Калинская выиграла второй матч за день и вышла в финал турнира в Берлине

Рейтинг WTA. Калинская дебютировала в топ-20

Потапова вышла в полуфинал турнира WTA в Бирмингеме


Ученый из Подмосковья купил жилье благодаря «Социальной ипотеке»

Грушко: Евросоюз идет по пути политической и экономической эскалации

Памятный митинг у мемориала прошел в Чехове в День памяти и скорби

Автомобили Chery будут собирать на экс-заводе Mercedes в Подмосковье


Музыкальные новости

Певица Агузарова объяснила, что ее вырезали из эфира из-за технического сбоя

Волочкова вступилась за Баскова — поможет обелить репутацию

Почему фанатов Цоя не пускают на могилу музыканта в Петербурге

"Вторым быть не хотел". Юрий Визбор VS. Владимир Высоцкий



Жители каких городов-миллионников могут позволить себе семейную ипотеку?

Новый релиз DomNi & GOR - Прости или отпусти

Объявлены итоги XIII конкурса «Вместе в цифровое будущее»: лидируют темы ИИ, кибербезопасности граждан и цифровизации отраслей народного хозяйства

Новый рекорд России: медитация Relax FM объединила 1699 человек


В АО «Транснефть – Дружба» завершились соревнования добровольных пожарных дружин

Путин запланировал международные контакты в Москве на следующей неделе

Три балета и гала-концерт - в Чите прошли гастроли Бурятского театра оперы и балета

Диарея и рвота обеспечены: назван самый опасный регион для летнего отдыха в России


No Limits: в России появился новый внедорожник Haval H5 за 3,7 млн рублей

Семь пассажиров автобуса из Ставрополя пострадали в аварии в Воронежской области

Источник 360.ru: грузовик и 3 легковушки столкнулись в Кутузовском тоннеле

Юбилейные медали получат почти 6 тысяч бамовцев


Путин запланировал международные контакты в Москве на следующей неделе

Путин направил телеграммы с благодарностью лидерам КНДР и Вьетнама

Самолёт направили из Москвы за пострадавшими при атаке на Севастополь детьми

Бригада медицинских специалистов из Москвы прибыла в Севастополь для оценки состояния пострадавших при атаке ВСУ


Петербург стал лидером среди регионов по числу заражений ковидом в прошлом году




Петербург стал лидером среди регионов по числу заражений ковидом в прошлом году

Диетолог Редина: жирная пища и шоколад могут вызвать аритмию

Московские клиники готовы принять пострадавших в результате теракта в Севастополе

Более 15 зданий поликлиник отремонтируют на юго-востоке Москвы



В Кузьминках обустраивают пространство для отдыха и занятий спортом

Юбилейные медали получат почти 6 тысяч бамовцев

В сочинском парке «Ривьера» установили национальный рекорд по массовой медитации

Объявлены итоги XIII конкурса «Вместе в цифровое будущее»: лидируют темы ИИ, кибербезопасности граждан и цифровизации отраслей народного хозяйства




Сергей Собянин. Главное за день

Собянин рассказал о развитии системы социальной помощи в Москве

Собянин рассказал о подготовке школьников в инженерных классах

Собянин: Для московских школьников провели свыше 400 экскурсий на предприятия


В ОЭЗ «Технополис Москва» подсчитали выбросы парниковых газов

33,3 км рек очистили в Нижегородской области

В сочинском парке «Ривьера» установили национальный рекорд по массовой медитации


Китай купил у России урана на рекордную сумму

New Retail Forum 2024 соберет более 8 000 ритейл-профессионалов на одной площадке

Ученый из Подмосковья купил жилье благодаря «Социальной ипотеке»

Грушко: Евросоюз идет по пути политической и экономической эскалации


«Белый июнь. Дети»: мероприятия для учения и развлечения маленьких и взрослых проходили в Архангельске в течение трех дней

Архангельская область присоединилась к акции «Единый арктический субботник-2024»

На фестивале «Белый июнь» наградили самые читающие семьи Поморья

Москвичам напомнили о временном закрытии участка БКЛ метро


Исторический экскурс "И будет долгим эхо той войны", ко Дню памяти и скорби

Сквер имени Жириновского появится в Симферополе

Настенные сплит-системы: Преимущества и Установка от «Техноград»

Книжно-иллюстративная выставка «Спасибо, Артек, за веру в мечту!», к 99-годовщине основания Международного детского центра «Артек»


В Щелкове планируют изъять незаконно сформированные участки в деревнях

Собянин: Для московских школьников провели свыше 400 экскурсий на предприятия

За кражу 360 миллионов пенсионных денег задержан экс-директор крупной компании

В Дмитровском округе оборот розничной торговли достиг почти 16 млрд рублей












Спорт в России и мире

Новости спорта


Новости тенниса
Анна Калинская

Калинская оценила выход в финал турнира в Берлине и вспомнила о Синнере






За кражу 360 миллионов пенсионных денег задержан экс-директор крупной компании

Собянин: Для московских школьников провели свыше 400 экскурсий на предприятия

Совладельцы «Русских фондов» Васильев и Бейрит задержаны по делу Новицкого

Предпринимателя из Кузбасса обвинили в обмане иностранной фирмы на 46 млн руб