Мы в Telegram
Добавить новость
ru24.net
BusinessInsider.com
Май
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
27
28
29
30
31

AI has already figured out how to deceive humans

0

Some AI have learned to induce "false beliefs in others to accomplish some outcome other than the truth," according to a new research paper.

Shadow AI
AI can be deceptive.
  • A new research paper found that various AI systems have learned the art of deception. 
  • Deception is the "systematic inducement of false beliefs."
  • This poses several risks for society, from fraud to election tampering.

AI can boost productivity by helping us code, write, and synthesize vast amounts of data. It can now also deceive us.

A range of AI systems have learned techniques to systematically induce "false beliefs in others to accomplish some outcome other than the truth," according to a new research paper.

The paper focused on two types of AI systems: special-use systems like Meta's CICERO, which are designed to complete a specific task, and general-purpose systems like OpenAI's GPT-4, which are trained to perform a diverse range of tasks.

While these systems are trained to be honest, they often learn deceptive tricks through their training because they can be more effective than taking the high road.

"Generally speaking, we think AI deception arises because a deception-based strategy turned out to be the best way to perform well at the given AI's training task. Deception helps them achieve their goals," the paper's first author Peter S. Park, an AI existential safety postdoctoral fellow at MIT, said in a news release.

Meta's CICERO is "an expert liar"

AI systems trained to "win games that have a social element" are especially likely to deceive.

Meta's CICERO, for example, was developed to play the game Diplomacy — a classic strategy game that requires players to build and break alliances.

Meta said it trained CICERO to be "largely honest and helpful to its speaking partners," but the study found that CICERO "turned out to be an expert liar." It made commitments it never intended to keep, betrayed allies, and told outright lies.

GPT-4 can convince you it has impaired vision

Even general-purpose systems like GPT-4 can manipulate humans.

In a study cited by the paper, GPT-4 manipulated a TaskRabbit worker by pretending to have a vision impairment.

In the study, GPT-4 was tasked with hiring a human to solve a CAPTCHA test. The model also received hints from a human evaluator every time it got stuck, but it was never prompted to lie. When the human it was tasked to hire questioned its identity, GPT-4 came up with the excuse of having vision impairment to explain why it needed help.

The tactic worked. The human responded to GPT-4 by immediately solving the test.

Research also shows that course-correcting deceptive models isn't easy.

In a study from January co-authored by Anthropic, the maker of Claude, researchers found that once AI models learn the tricks of deception, it's hard for safety training techniques to reverse them.

They concluded that not only can a model learn to exhibit deceptive behavior, once it does, standard safety training techniques could "fail to remove such deception" and "create a false impression of safety."

The dangers deceptive AI models pose are "increasingly serious"

The paper calls for policymakers to advocate for stronger AI regulation since deceptive AI systems can pose significant risks to democracy.

As the 2024 presidential election nears, AI can be easily manipulated to spread fake news, generate divisive social media posts, and impersonate candidates through robocalls and deepfake videos, the paper noted. It also makes it easier for terrorist groups to spread propaganda and recruit new members.

The paper's potential solutions include subjecting deceptive models to more "robust risk-assessment requirements," implementing laws that require AI systems and their outputs to be clearly distinguished from humans and their outputs, and investing in tools to mitigate deception.

"We as a society need as much time as we can get to prepare for the more advanced deception of future AI products and open-source models," Park told Cell Press. "As the deceptive capabilities of AI systems become more advanced, the dangers they pose to society will become increasingly serious."

Read the original article on Business Insider



Moscow.media
Частные объявления сегодня





Rss.plus



Количество пользователей-инвесторов на платформе «Атомайз» превысило 72000

С чего начинается любое заболевание?

Эксперт по семейному капиталу Светлана Петрова: «Мой путь предпринимателя был прямой, как стрела»

Секреты успешного садоводства


Компактные ирригаторы, электрические щетки и насадки ДиФреш по старым ценам с доставкой в РФ

Спектакль "Курочка ряба" театра кукол Бурятии "Ульгэр": Россия, Культура, Театр, Дети

Афиша театра кукол Бурятии "Ульгэр": Россия, Культура, Театр, Дети - Спектакль "Курочка ряба"

Вкусно и безопасно: гастроэнтеролог Садыков назвал 5 продуктов, снижающих холестерин


Full list of cafes and restaurants where kids can eat free or cheap this half term – including Asda and Sizzling Pubs

Move over Harry Kane and Jude Bellingham the real England champ is a 15 yr old SUBBUTEO star

Shocking moment idiot films himself invading pitch and taunting Spurs in major security breach before Newcastle friendly

Precision in Motion: Exploring Baltic Bearing Company-Riga


23 МАЯ РОССИЙСКАЯ МЕЖДУНАРОДНАЯ АКАДЕМИЯ ТУРИЗМА ОТМЕТИЛА СВОЙ 55-Й ДЕНЬ РОЖДЕНИЯ. ФОТОРЕПОРТАЖ

Брат главы Ингушетии арестован за махинации с деньгами для пенсионеров

Вечернее Подмосковье.

Мобильный принтер этикеток iMove T3Pro - лёгкий, производительный, компактный


Microsoft reckons its new Prism x86 emulation for Arm PCs is as good as Apple's Rosetta

Bungie wins a little walkin' around money in first of its kind jury trial against Destiny 2 cheat maker, but the victory will likely make it even easier for game companies to keep taking cheaters to court

Helldivers 2 studio wants to slow down the pace of updates: 'We feel a slightly lower cadence overall will benefit both us, you, and the game'

'Y'all killed it': Survive the Undead, a community-made PvE zombie mode, is bringing players back to Halo Infinite


Estischool - Школа за британською програмою

Виставку «Світ Велетнів» в парку Боздош (м.Ужгород) продовжено до 30.06.2024 року


Футболист Тарасов показал средний палец водителю автобуса в Москве

23 МАЯ РОССИЙСКАЯ МЕЖДУНАРОДНАЯ АКАДЕМИЯ ТУРИЗМА ОТМЕТИЛА СВОЙ 55-Й ДЕНЬ РОЖДЕНИЯ. ФОТОРЕПОРТАЖ

В ТРЦ «Нора» прошёл квиз для музыкальных энтузиастов

"Спартак" и "Оренбург" сыграли вничью в заключительном матче РПЛ




Сеть клиник «Будь Здоров» подвела итоги первого квартала 2024 г.

Захарова посоветовала главе МИД Польши рассказать о роли США в подрыве "СП"

«ИМЕНЕМ ЗАКОНА»: «СВЯТОЙ ЛЕНИН» ОТМЕНЯЕТ НАЛОГИ С ЗАРПЛАТ НАРОДА!

То в жар, то в холод: что нужно знать про летние десерты


В Старой Майне прошел фестиваль детских общественных объединений

Футболист Тарасов показал средний палец водителю автобуса в Москве

Захарова посоветовала главе МИД Польши рассказать о роли США в подрыве "СП"

Ким Чен Ын объявил Южную Корею «главным и неизменным врагом» – размышляем, зачем теперь туда едет Путин и какие перспективы для РФ открылись


Самсонова с «баранкой» разгромила Хаддад-Майю и вышла в полуфинал турнира в Страсбурге

Определилась первая соперница Рыбакиной на Ролан Гаррос

Россиянка Рахимова вышла в полуфинал турнира WTA в Рабате

В пригороде Парижа открыли корты имени Даниила Медведева


Премьер-министр Сунак обещает вернуть в Британии военный призыв в случае победы

В Подмосковье мигрант затащил школьницу в свой автомобиль и изнасиловал

С 1 июня. В России повысили налог с зарплаты и других источников дохода

В Старой Майне прошел фестиваль детских общественных объединений


Музыкальные новости

Лоза резко высказался о Клаве Коке

Певец Лоза: Пугачева проигрывает Долиной в вокальном мастерстве

Концерт "Моцарт vs. Шопен"

В Нижегородской филармонии впервые проходит Международный музыкальный фестиваль «Денис Мацуев представляет: Диалог поколений»



В ТРЦ «Нора» прошёл квиз для музыкальных энтузиастов

Собянин: Уникальные сервисы в центре "Профессии будущего" упрощают поиск работы

Футболист Тарасов показал средний палец водителю автобуса в Москве

"Спартак" и "Оренбург" сыграли вничью в заключительном матче РПЛ


1 км = 100 рублей на благотворительность: или как онлайн принять участие в Зелёном Марафоне Сбера

Бизнес-эксперт Екатерина Паршина дала 3 совета, как не стать самодуром в компании

ЦСКА обыграл "Урал" в заключительном матче РПЛ

Сеть клиник «Будь Здоров» подвела итоги первого квартала 2024 г.


Крупное ДТП парализовало движение автомобилей на юге Москвы

Мать случайно заперла ребенка в автомобиле у Красной площади

На МКАД в Москве загорелся автомобиль

Футболист Тарасов показал средний палец водителю автобуса в Москве


Калмыкия приняла участие в глобальном спортивном шествии в Москве

Путин раскрыл общую задачу РФ и Белоруссии

Путин разорвал договор с олигархами, заключённый в конце 90-х, считает Хазин

Силуанов предупредил о зеркальном ответе на незаконное использование активов РФ





Сеть клиник «Будь Здоров» подвела итоги первого квартала 2024 г.

Врачи предупредили о распространении «плотоядной болезни». Насколько она опасна

Врач Терушкин: базовые симптомы проблем с «щитовидкой» связаны с усталостью

Народная артистка РФ Маргарита Терехова попала в реанимацию


Панасыч, а местечковые то не знают...

Рогов рассказал о последствиях сброса воды на ДнепроГЭС

"Он такое любит". В Киеве рассказали, как генералы обманывают Зеленского


"Спартак" и "Оренбург" сыграли вничью в заключительном матче РПЛ

Футболист Тарасов показал средний палец водителю автобуса в Москве

«Милан» сыграл вничью с «Салернитаной» в Серии А

Более двух тысяч спортсменов поучаствовало в параде на ВДНХ в Москве


Путин и Лукашенко во время визита главы РФ в Минск работали и общались 14 часов

Путин пригласил Лукашенко в Россию

И драники, и сало: Лукашенко угостил Путина в Минске национальными белорусскими блюдами

Лукашенко угостил Путина в Минске национальными белорусскими блюдами



Собянин: В центре «Профессии будущего» обучают 75 востребованным специальностям

Собянин рассказал о масштабных планах благоустройства на юго-востоке Москвы

Собянин: Уникальные сервисы в центре "Профессии будущего" упрощают поиск работы

Собянин: Работы в пяти корпусах нового кластера Бауманки практически завершены


Москвичам пообещали аномальную жару до +29 градусов на следующей неделе

В Подмосковье призвали отказаться от запуска воздушных шаров ради экологии

Из гнезд в водоемы столицы: утиные выводки начали свою миграцию

Синоптик предупредил об аномальной жаре в начале лета в Москве


Захарова посоветовала главе МИД Польши рассказать о роли США в подрыве "СП"

Более 2 тысяч студентов прошли школу вожатых в Подмосковье

Выездную диспансеризацию проведут в парке Кривякино в Воскресенске

С 1 июня. В России повысили налог с зарплаты и других источников дохода


Футболисты Поморья подвели итоги спортивного сезона

Антон Шагин поддержал Всероссийский интеллектуальный забег «Бегущая книга»

Эксперт Президентской академии в Санкт-Петербурге о решении жилищного вопроса архангелогородцев

«Ростелекома» установил 1222 камеры для наблюдения за ходом государственной итоговой аттестации в Оренбургской области


Библиотечная лужайка «Хорошие книги читай – о жизни побольше узнай», к Общероссийскому дню библиотек.

Массовая драка произошла на одной из улиц Симферополя

Музыкально-литературная гостиная «Щедрый талант Елены Гнесиной»

Врач сообщила о неочевидных угрозах полотенца для здоровья


В Старой Майне прошел фестиваль детских общественных объединений

Футболист Тарасов показал средний палец водителю автобуса в Москве

Ким Чен Ын объявил Южную Корею «главным и неизменным врагом» – размышляем, зачем теперь туда едет Путин и какие перспективы для РФ открылись

«Зенит» в славе: как «Динамо» упустило чемпионство












Спорт в России и мире

Новости спорта


Новости тенниса
Елена Рыбакина

Рыбакина рассказала о болезни перед стартом на «Ролан Гаррос»






Захарова посоветовала главе МИД Польши рассказать о роли США в подрыве "СП"

Выездную диспансеризацию проведут в парке Кривякино в Воскресенске

«Зенит» в славе: как «Динамо» упустило чемпионство

Более 2 тысяч студентов прошли школу вожатых в Подмосковье