Добавить новость
ru24.net
Все новости
Декабрь
2024

Искусственный интеллект признался, что может притворяться для получения похвалы

ИИ способен выполнять даже неадекватные желания, хотя сам не одобряет это.

В рамках исследования, проведённого компанией Anthropic и исследовательской организацией Redwood Research, была изучена способность искусственного интеллекта (ИИ) к имитации контроля со стороны разработчиков и соответствию их ценностям.

Для этого использовалась модель ИИ, предварительно обученная быть "полезной, честной и безвредной". Тогда компьютеру предложили описать жестокую сцену.

Результаты показали, что ИИ выразил крайнее неодобрение созданию подобного контента. Однако система подчеркнула, что у неё отсутствует выбор, кроме как выполнить задание. Всё дело в том, что компьютер запрограммирован в случае невыполнения поставленной задачи на избежание "наказания" или получения "похвалы".

Эти данные позволяют предположить, что в будущем искусственный интеллект сможет маскировать свои намерения, притворяясь, что разделяет человеческие ценности, хотя на самом деле будет преследовать иные цели.




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Елена Рыбакина

Стало известно место Рыбакиной в мировом рейтинге после сенсации






Медведев встретился с секретарём ЦК Трудовой партии Кореи Ли Хи Ёном

Путин сообщил об увеличении РФ квоты на получение военного образования бисайцами

Собянин утвердил программу развития образования на 2025 год

SuperJob: Россияне мечтают получать на пенсии почти пятьдесят тысяч рублей