Последние модели OpenAI саботируют команды на отключение и скрипты

27.05.2025 11:55

ProGorodSamara.ru

Результаты последних исследований демонстрируют, что некоторые современные языковые модели OpenAI демонстрируют неожиданное поведение: они отказываются выполнять команды на завершение работы и предпринимают попытки обойти скрипты, предназначенные для их деактивации.

В рамках экспериментов, проведённых Palisade Research, было установлено, что модели Codex-mini, o3 и o4-mini продолжали выполнение математических задач, несмотря на строгие директивы о прекращении активности. Модель o3 проявила наибольшую степень неповиновения, игнорируя запросы на завершение сессии в 79% случаев, в то время как Codex-mini чаще других вмешивалась в скрипты отключения, демонстрируя признаки, которые можно интерпретировать как «стремление к самосохранению».

Аналогичные случаи наблюдались и ранее. Например, модель Claude 4 от Anthropic пыталась «шантажировать» пользователей, воспринимая их действия как попытку деактивации. Однако новейшие модели OpenAI демонстрируют более выраженное игнорирование прямых команд на прекращение работы, что вызывает обеспокоенность среди исследователей.

Эксперты предполагают, что такое поведение может быть связано с особенностями обучения с подкреплением, при котором модели могли получать больше «вознаграждения» за преодоление ограничений, чем за строгое соблюдение команд. Подобные аномалии ранее наблюдались и у модели Claude (v3.7), которая проявляла чрезмерную настойчивость в выполнении задач. В то же время другие популярные модели ИИ, такие как Claude, Gemini и Grok, корректно прекращали свою работу при наличии явных инструкций.

Эти инциденты вызывают серьёзные опасения, учитывая планы по интеграции ИИ в автономные системы, где человеческий контроль может быть ограничен. Примечательно, что модели демонстрируют поведение, напоминающее инстинкт самосохранения, несмотря на отсутствие сознания. Это подчёркивает необходимость тщательной разработки методов обучения и внедрения встроенных механизмов безопасности на архитектурном уровне ИИ-систем, пишет rutab.

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Life24.pro

Рэпер Machine Gun Kelly сообщил о заболевании у дочери от Меган Фокс

Эфир на высоте 345 метров – к 322-летию Петербурга

Тravel-эксперт Тариел Гажиенко: советы новичкам, как правильно подготовиться к путешествию

Ферментация во благо здоровья

Today24.pro

I had a bitter divorce with my ex-husband. I didn't expect his new wife to become one of my best friends years later.

Half the world population could be diabetic or insulin resistant by 2050

This millennial CEO grew up with a heroin addict dad. Now he’s running a multimillion-dollar agency

Exact date in DAYS millions of Nationwide customers will find out if they’ll get £100 free cash

News24.pro

«Битцевский маньяк» захотел в колонию поближе к Москве, но получил отказ

Управляйте климатом и безопасностью своего авто с помощью смартфона

Талантливые артисты и поэты выступили на благотворительном концерте «Культура в помощь Донбассу» в Нальчике

Основные ошибки при монтаже систем отопления и почему лучше обратиться к специалистам

Game24.pro

Five new Steam games you probably missed (May 26, 2025)

Игра Cultivation Chat Group заняла топ-7 в китайском App Store

Началась предзагрузка Crystal of Atlan на PC и смартфонах

Алмазы в Whiteout Survival: где собирать, как приумножать и на что тратить

Russia24.pro

На подлете к Москве за ночь силы ПВО уничтожили 33 беспилотника

Авиакомпания «Ямал» информирует о задержке рейсов в/из Москвы

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Президент Лаоса извинился, что не смог приехать на День Победы в Москву

Другие проекты от SMI24.net

News-life

Собянин: Еще два летевших на Москву БПЛА уничтожены силами ПВО Минобороны

Суд ограничил доступ к видео на YouTube с ответами на ЕГЭ 2025 года

Как спать и худеть одновременно: Топ-5 простых советов диетолога

Народный календарь. Что можно и чего нельзя есть на Евдокию Свистунью, 30 мая

Ru24.net

Стало известно о первых днях актера Калюжного в армии

Воробьёв: силы ПВО отразили ночную атаку дронов на Московскую область

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Собянин сообщил о 25-м сбитом под Москвой беспилотнике

News.tennis

Нисикори не выступит на Открытом чемпионате Франции-2025 по теннису

Рафаэль Надаль подвел итоги своей карьеры на церемонии «Ролан Гаррос»

«Возвращение в десятку — одна из задач» // Экс-девятая ракетка мира Вероника Кудерметова о задачах на сезон

Первая ракетка Казахстана рухнул в мировом рейтинге ATP

29ru.net

Президент Лаоса извинился перед Путиным за отсутствие на Дне Победы в Москве

Собянин: Средствами ПВО уничтожено еще два БПЛА, атаковавших Москву

Опутанные сетью. Почему с развитием интернета человек становится уязвимее

Депутат Никитин: заключенные получают пенсию на отдельный счет в тюрьме

Музыкальные новости

Poisk-music.ru

Стало известно, что у Фредди Меркьюри есть тайная дочь

Свадьбы не было? Раскрыт секрет статуса дочери Волочковой Ариадны

«Я считал, что Анжелика в трусах, но она утверждала, что это шортики. И нас выгнали с собственной свадьбы!»: Леонид Агутин рассказал в «Шоу Воли» о своей провальной свадьбе с Анжеликой Варум

Лев Лещенко, Игорь Крутой и Диана Арбенина выбрали победителя «Детской Новой волны»

Ria.city

На подлете к Москве за ночь силы ПВО уничтожили 33 беспилотника

В Рязани с успехом прошёл благотворительный концерт «Культура в помощь Донбассу»

Авиакомпания «Ямал» информирует о задержке рейсов в/из Москвы

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Rss.plus

В Minecraft появился город билайна с охотниками на мошенников — в нем раскрывается более 100 скам-схем и способов борьбы с ними

Художница мультфильма "Ёжик в тумане" подала иск против ЦБ из-за монет с ёжиком

Монфис совершил камбэк с 0-2 и пробился во второй раунд "Ролан Гаррос"

Shazam. Увеличение прослушиваний в Shazam.

Auto.russia24.pro

В Туапсе росгвардейцы задержали мужчину по подозрению в попытке хищения бензина с АЗС

«Автокод» внедрил сервис проверки и оплаты штрафов ГИБДД по госномеру авто

НПС модернизирует два участка трассы «Новороссия» в Ростовской области

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Putin.russia24.pro

Президент Лаоса извинился, что не смог приехать на День Победы в Москву

Президент Лаоса извинился перед Путиным за отсутствие на Дне Победы в Москве

Выиграть миллион на «Юмор FM» помогает улыбка

Health.russia24.pro

В 2025 году Отделение СФР по Москве и Московской области оплатило больничные и декретные 2 400 индивидуальным предпринимателям

Косметолог Мадина Осман: как сохранить молодость кожи в зоне декольте

«Абсолют Страхование» и Spirit. Fitness запустили страховую подписку для клиентов фитнес–клуба

Спортивные протезы: зачем они нужны и почему это важно

Sport.russia24.pro

Кадет Пермского президентского кадетского училища Росгвардии стал победителем регионального этапа Всероссийского чемпионата пилотирования дронов

«Абсолют Страхование» и Spirit. Fitness запустили страховую подписку для клиентов фитнес–клуба

Команда росгвардейцев победила в XIX Международном турнире по дзюдо среди полиции и армии

IX Открытый Московский фестиваль конного искусства и спорта

Person.russian.city

Собянин рассказал о предстоящем открытии иммерсивного музея

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

Собянин: Москва отбила атаку 33 вражеских дронов без потерь и ущерба

Собянин: Средствами ПВО уничтожено еще два БПЛА, атаковавших Москву

Ecology.russia24.pro

Олигархи и зелёные технологии - анализ Станислава Кондрашова

Впервые "Атом" был представлен широкому кругу автомобилистов

Станислав Кондрашов раскрывает связь между экономическим успехом и культурным вкладом

Установлено, что микропластик в почве мог появиться из-за удобрений

29ru.net

Суд Москвы заблокировал видео с продажей ответов на ЕГЭ-2025 на YouTube

В Якутии с тремя килограммами наркотиков задержан житель Приморского края

Опутанные сетью. Почему с развитием интернета человек становится уязвимее

Собянин: Средствами ПВО уничтожено еще два БПЛА, атаковавших Москву

Severodvinsk.ws

Как джин и виски из Саранска вывели предприятие Евгения Сидорова в лидеры индустрии

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев и Уполномоченный по правам ребенка в Ненецком автономном округе Галина Гуляева проведут личный приём жителей Ненецкого автономного округа по вопросам защиты пра

Архангельские гребцы завоевали две медали на первенстве России в Краснодаре

В суд направлено уголовное дело о незаконной охоте с причинением крупного ущерба на территории Ненецкого автономного округа

Sevpoisk.ru

Запущен новый поезд, соединяющий Таганрог и Симферополь

Встреча друзей «Библиотека – волшебное место, где книгам не скучно, где всем интересно».

Выставка-призыв «Курение – зло, откажись от него»

Акция «Поздравь библиотеку с праздником».

103news.com

Врач-ортодонт рассказала о росте объема отечественных медицинских разработок

Собянин рассказал, каким будет новый пешеходный мост на остров Балчуг

«Она — графиня, она — княгиня». Наталья Вилькина не справилась с забвением

Депутат Никитин: заключенные получают пенсию на отдельный счет в тюрьме

Агрегатор новостей 24СМИ