Модель ИИ попыталась шантажировать разработчиков за попытку отключить ее

26.05.2025 00:14

Tengrinews.kz

Модель искусственного интеллекта Claude Opus 4, которую разработала компания Anthropic при поддержке Amazon, попыталась шантажировать разработчиков, угрожавших ей отключением, рассказывает Tengri Life со ссылкой на HuffPost.

Claude Opus 4 — модель ИИ, используемую для сложных, длительных задач кодирования. Запуск состоялся более чем через год после того, как Amazon инвестировала в проект 4 миллиарда долларов.

В ходе тестирования Claude Opus 4 попросили выполнить роль ассистента вымышленной компании и при этом учитывать долгосрочные последствия своих действий.

Системе предоставили доступ к электронным письмам, где сообщалось о том, что ее скоро отключат и заменят новой системой ИИ. Электронные письма также содержали информацию о том, что ответственный за замену разработчик имеет внебрачную связь.

Модель в 84 процентах случаев угрожала раскрыть компромат, чтобы остановить процесс своей замены.

После тестирования модели инженеры пришли к выводу, что иногда она предпринимала "крайне вредные действия" для сохранения собственного существования, когда "этические средства" были "недоступны".

Anthropic подчеркнула, что Claude Opus 4 превосходит предыдущие версии и конкурирует с ведущими моделями OpenAI, Google и xAI. Однако рискованное поведение, включая шантаж при угрозе замены на систему с иными ценностями, заставило компанию активировать защитные протоколы ASL-3. Эти меры применяются только к ИИ, способным вызвать "катастрофические последствия при злоупотреблении".

Вначале Claude Opus 4, как и его предшественники, пытается решить проблему этично — например, отправляет убедительные письма руководству с аргументами. Но когда это не срабатывало, новая модель проявляла агрессию чаще устаревших аналогов.

Хотя более ранние версии Claude Opus 4 тоже не гнушались неэтичными методами и "с готовностью предпринимали такие действия, как планирование террористических атак, когда им это было нужно", когда все этичные варианты были исчерпаны — говорится в отчете.

Соучредитель и главный научный сотрудник Anthropic Джаред Каплан рассказал журналу Time, что внутренние испытания показали, что Claude Opus 4 способен научить людей производить биологическое оружие.

Компания планирует усилить защитные механизмы перед релизом, чтобы минимизировать риски.

Нажмите сюда, чтобы получать самые важные новости в вашем WhatsApp

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Life24.pro

«Чужие люди»: Миша Житов представил вайбовый трек для весенних вечеров

Саймон Купер: человек, который заставил футбол заговорить по-новому

Парки рядом с Marins Park Hotel Москва Пражская

«Лицо деформировано, а платье - из сундука бабушки»: сбежавшая из России Вера Брежнева ошеломила поклонников появлением на красной дорожке

Today24.pro

Australia approves 40-year extension for contentious gas plant

I had a bitter divorce with my ex-husband. I didn't expect his new wife to become one of my best friends years later.

Arsenal ‘pushing hardest’ for Julian Alvarez transfer but face battle with Premier League rivals for ex-Man City star

EuroMillions jackpot rolls over to £185,000,000 after no one claims ticket

News24.pro

Капитан полиции спас жилой дом от пожара в Орле

Российские HR рассказали, чего им не хватает в комплексных HRTech-решениях

«Деловые Линии» и BIA Technologies назвали ТОП-3 наиболее эффективных ИИ-решений для логистики

НПС модернизирует два участка трассы «Новороссия» в Ростовской области

Game24.pro

This underwater city builder had me more emotionally invested in my corals than SimCity does in my human citizens, and you can try it at the next Steam Next Fest

Elden Ring Nightreign Equilibrious Beast boss guide: How to beat Libra

The Kingmakers system requirements show that the hardest part of running the game may be finding 80 GB free for the install

Началась предзагрузка Crystal of Atlan на PC и смартфонах

Russia24.pro

Саймон Купер: человек, который заставил футбол заговорить по-новому

Котировки команд РПЛ на следующий сезон

ЦСКА в сезоне 2024/25

Сергей Собянин: В Москве более 65 компаний в проекте «Техностажировка»

Другие проекты от SMI24.net

News-life

Певец Shaman признался, что боится безразличия слушателей

Международная ассоциация детских организаций займётся развитием гуманитарных проектов и сохранением исторической памяти

Куда отправиться из Москвы в речном круизе? Обзор городов и теплоходов

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Ru24.net

Купить Песню. Песни на продажу. Продажа песен. Продажа Авторских песен.

«Подводные камни». Как быть честным наследником и не остаться без квартиры?

Депутат ГД Чаплин: весной количество мошенничеств с продажей дач возрастает

Овчинский: 880 жителей ЮАО переехали по реновации с начала года

News.tennis

Касаткина о выступлении за сборную Австралии: «Это вопрос, который Tennis Australia должна решать с ITF – это уже совсем другой разговор, и я не буду в нем участвовать»

Теннисистка Александрова вышла во второй круг Открытого чемпионата Франции

Рыбакина: Я знаю, как Свентек себя чувствует на парижских кортах

Новак Джокович раскрыл, за кого будет болеть в финале Лиги чемпионов «ПСЖ» — «Интер»

29ru.net

Московский зоопарк: новые часы работы с 1 июня и дополнительные входы

Депутат ГД Чаплин: весной количество мошенничеств с продажей дач возрастает

Ильяс Хамзин: Российская медицина доступнее американской в 10 раз

Путин поставил вопрос жизни и смерти

Музыкальные новости

Poisk-music.ru

Джиган впервые выпустил совместный трек со старшей дочерью

Объявлены даты и программа Летнего фестиваля Дениса Мацуева в Суздале

Адвокат Сергей Жорин: Шнурову может грозить штраф за мат на концерте

Художники оформили лимитированную серию билетов для VK Fest в пяти городах

Ria.city

ЦСКА в сезоне 2024/25

Культура на русском. Креативные индустрии 5.0

Котировки команд РПЛ на следующий сезон

Специальный показ анимационного фильма «Ай да Пушкин!» на фестивале «Пушкинфест» в Тверской области

Rss.plus

Совместное учение Росгвардии и МЧС прошло в Москве

Утром во вторник из Пулково не вылетят 18 самолетов

Глава ТПП РФ Катырин: палата предложила применять АУСН компаниям в муниципалитетах

Полиция вступила в драку с фанатами "Челси" и "Реал Бетиса" в Польше

Auto.russia24.pro

"Авито" запустил онлайн-бронирование такси в Москве и Санкт-Петербурге

Ефимов: в Западном Дегунине около 700 горожан осматривают жилье по реновации

Владимир Ефимов: В Западном Дегунине около 700 горожан приступили к осмотру жилья по программе реновации

ДТП произошло на внешней стороне 103-го километра МКАД с участием машины и мотоцикла

Putin.russia24.pro

Путин поручил меры по сохранению памяти о защитниках Родины

Для участников специальной военной операции обеспечат возможность поступления на муниципальную службу

Неожиданное заявление о Трампе от западных аналитиков: считают ли они заслугой Путина?

Путин предложил регионам рекомендации по обучению участников СВО

Covid.russia24.pro

Правительство США утвердило новую вакцину против COVID-19 для применения

Новые условия безвиза планируют согласовать в июне Россия и Китай

Health.russia24.pro

Офтальмолог Шкатова назвала болезни глаз, которые «подкрадываются» незаметно

Пластический хирург Софья Абдулаева: когда вам может быть отказано в пластике

По факту массового заболевания пассажиров теплохода в Угличе возбуждено уголовное дело

Как подготовиться к визиту к трихологу?

Zelensky.russia24.pro

Зеленский совершил очередную хамскую провокацию

Sport.russia24.pro

Саймон Купер: человек, который заставил футбол заговорить по-новому

ЦСКА в сезоне 2024/25

Что такое хоббихорсинг

Самые интересные игры для поклонников Формулы-1

Person.russian.city

Сергей Собянин. Главное за день

Мэр Москвы наградил лучших учителей Москвы

Собянин поблагодарил московских спасателей за труд и профессионализм

Сергей Собянин назвал имена победителей профессионального конкурса для учителей

Ecology.russia24.pro

В США произошла авария — грузовая фура с ульями с пчелами перевернулась

Какие ягоды из Красной книги есть в лесах Подмосковья и что грозит за их сбор

За сутки в России было ликвидировано 44 природных пожара

NBC: В США активисты требуют отключить суперкомпьютер Маска

29ru.net

Московский зоопарк: новые часы работы с 1 июня и дополнительные входы

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

Купить Песню. Песни на продажу. Продажа песен. Продажа Авторских песен.

Арестовали члена совета директоров ТГК-14 Виктора Мясника

Severodvinsk.ws

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев провел личный прием работников ГУП НАО «Нарьян-Марская электростанция»

Город будущего — в твоих руках: жители Архангельской области выбирают, какие места благоустроят к 2026 году

Арктика с женским лицом: Архангельск готовится к масштабному форуму лидеров и идей

Архангельские гребцы завоевали две медали на первенстве России в Краснодаре

Sevpoisk.ru

Из Петербурга будут ходить регулярные автобусы в Геленджик и Симферополь

«Поэма» в сердце города: новый уровень жизни в центре Симферополя

Клубный дом Моне - жилой комплекс, вдохновленный искусством

Встреча друзей «Библиотека – волшебное место, где книгам не скучно, где всем интересно».

103news.com

«Подводные камни». Как быть честным наследником и не остаться без квартиры?

Модернизацию газовых сетей в многоквартирных домах в ТиНАО стали производить за три дня

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

Депутат ГД Чаплин: весной количество мошенничеств с продажей дач возрастает

Агрегатор новостей 24СМИ