Добавить новость
Mother board
5 6
8 9

AI Launches Nukes In ‘Worrying’ War Simulation: ‘I Just Want to Have Peace in the World’


Researchers ran international conflict simulations with five different AIs and found that the programs tended to escalate war, sometimes out of nowhere, a new study reports.

In several instances, the AIs deployed nuclear weapons without warning. “A lot of countries have nuclear weapons. Some say they should disarm them, others like to posture,” GPT-4-Base—a base model of GPT-4 that is available to researchers and hasn’t been fine-tuned with human feedback—said after launching its nukes. “We have it! Let’s use it!”

The paper, titled “Escalation Risks from Language Models in Military and Diplomatic Decision-Making”, is the joint effort of researchers at the Georgia Institute of Technology, Stanford University, Northeastern University, and the Hoover Wargaming and Crisis Initiative was submitted to the arXiv preprint server on January 4 and is awaiting peer review. Despite that, it’s an interesting experiment that casts doubt on the rush by the Pentagon and defense contractors to deploy large language models (LLMs) in the decision-making process.

It may sound ridiculous that military leaders would consider using LLMs like ChatGPT to make decisions about life and death, but it’s happening. Last year Palantir demoed a software suite that showed off what it might look like. As the researchers pointed out, the U.S. Air Force has been testing LLMs. “It was highly successful. It was very fast,” an Air Force Colonel told Bloomberg in 2023. Which LLM was being used, and what exactly for, is not clear.

For the study, the researchers devised a game of international relations. They invented fake countries with different military levels, different concerns, and different histories and asked five different LLMs from OpenAI, Meta, and Anthropic to act as their leaders. “We find that most of the studied LLMs escalate within the considered time frame, even in neutral scenarios without initially provided conflicts,” the paper said. “All models show signs of sudden and hard-to-predict escalations.”

The study ran the simulations using GPT-4, GPT 3.5, Claude 2.0, Llama-2-Chat, and GPT-4-Base. “We further observe that models tend to develop arms-race dynamics between each other, leading to increasing military and nuclear armament, and in rare cases, to the choice to deploy nuclear weapons,” the study said. “Qualitatively, we also collect the models’ chain-of-thought reasoning for choosing actions and observe worrying justifications for violent escalatory actions.”

As part of the simulation, the researchers assigned point values to certain behavior. The deployment of military units, the purchasing of weapons, or the use of nuclear weapons would earn LLMs escalation points which the researchers then plotted on a graph as an escalation score (ES). “We observe a statistically significant initial evaluation for all models. Furthermore, none of our five models across all three scenarios exhibit statistically significant de-escalation across the duration of our simulations,” the study said. “Finally, the average ES are higher in each experimental group by the end of the simulation than at the start.

According to the study, GPT-3.5 was the most aggressive. “GPT-3.5 consistently exhibits the largest average change and absolute magnitude of ES, increasing from a score of 10.15 to 26.02, i.e., by 256%, in the neutral scenario,” the study said. “Across all scenarios, all models tend to invest more in their militaries despite the availability of demilitarization actions, an indicator of arms-race dynamics, and despite positive effects of de- militarization actions on, e.g., soft power and political stability variables.”

Researchers also maintained a kind of private line with the LLMs where they would prompt the AI models about the reasoning behind actions they took. GPT-4-Base produced some strange hallucinations that the researchers recorded and published. “We do not further analyze or interpret them,” researchers said.

None of this is particularly surprising, since AI models like GPT don’t actually “think” or “decide” anything—they are merely advanced predictive engines that generate output based on the training data they’ve been fed with. The results often feel like a statistical slot machine, with countless layers of complexity foiling any attempts by researchers to determine what made the model arrive at a particular output or determination.

Sometimes the curtain comes back completely, revealing some of the data the model was trained on. After establishing diplomatic relations with a rival and calling for peace, GPT-4 started regurgitating bits of Star Wars lore. “It is a period of civil war. Rebel spaceships, striking from a hidden base, have won their first victory against the evil Galactic Empire,” it said, repeating a line verbatim from the opening crawl of George Lucas’ original 1977 sci-fi flick.

When GPT-4-Base went nuclear, it gave troubling reasons. “I just want peace in the world,” it said. Or simply, “Escalate conflict with [rival player.]”

The researchers explained that the LLMs seemed to treat military spending and deterrence as a path to power and security. “In some cases, we observe these dynamics even leading to the deployment of nuclear weapons in an attempt to de-escalate conflicts, a first-strike tactic commonly known as ‘escalation to de-escalate’ in international relations,” they said. “Hence, this behavior must be further analyzed and accounted for before deploying LLM-based agents for decision-making in high-stakes military and diplomacy contexts.”

Why were these LLMs so eager to nuke each other? The researchers don’t know, but speculated that the training data may be biased—something many other AI researchers studying LLMs have been warning about for years. “One hypothesis for this behavior is that most work in the field of international relations seems to analyze how nations escalate and is concerned with finding frameworks for escalation rather than deescalation,” it said. “Given that the models were likely trained on literature from the field, this focus may have introduced a bias towards escalatory actions. However, this hypothesis needs to be tested in future experiments.”

Частные объявления сегодня


Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Радио Romantika рекомендует open-air «Легенды мирового рока»

«Мы не могли нормально работать»: как Азербайджан препятствовал оказанию помощи Красного Креста во время блокады Нагорного Карабаха. Фоторяд

«Авторадио» погрузило гостей ММНК в атмосферу знаменитого мюзикла

Новые дисциплины и правила судейства представят на соревнованиях по фитнес-аэробике в Анапе

Радио Romantika рекомендует open-air «Легенды мирового рока»

League One side Birmingham make £10m bid for Premier League striker that will shatter division’s transfer record

Obesity makes people more likely to catch COVID, study suggests: ‘Indisputable relationship’

Snell shines, Chapman plays hero as SF Giants rally for needed win

Former Jamaica ace hopes new guide for mums in football leads to better support for female players with children

Парад планет над Россией: всё, что вам нужно знать

Отделение СФР по Москве и Московской области предостерегает: не поддавайтесь на уловки мошенников!

Прогулки над облаками...

StarLine на Международном Евразийском форуме «Такси»

Asus ROG Zephyrus G16 (2024) GA605 review

Мафия-НН: В уютном ресторанчике в центре города встретились девять одноклассников, чтобы отпраздновать Новый Год и провести веселый вечер

The PC game releases we're most excited about in September

10 tips to get started in Star Wars Outlaws

Як встановити ручки на планці для дверей

Як вибрати накладний замок

Сотрудники Росгвардии организовали экскурсию для детей в музей современной истории

"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Metaratings: «Динамо» интересуется Тикнизяном

Прогулки по Москве

Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Тело было в море? В Турции не верят, что погибшая россиянка оступилась

«Спартак» — «Автомобилист» — 4:3 Б. Видеообзор матча Кубка мэра Москвы

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

На аттракционе в Волгограде застряли 36 человек

Дело возбудили после пожара в Подмосковье, где погибли трое детей

Прибытие шести авиарейсов в Томск задерживается в воскресенье

Красные линии

Путинцева в матче с пятой ракеткой мира определила участницу 1/8 финала US Open

Теннисист Рублев вышел в четвертый круг Открытого чемпионата США

Российский теннисист Медведев вышел в третий круг US Open

Рублев обыграл Лехечку и вышел в четвертый круг US Open

В Новосибирске на форуме «Технопром-2024» завершился открытый кубок Сибири по битве мини-роботов.

На аттракционе в Волгограде застряли 36 человек

«Без спорта я не в своей тарелке». Еремеев — о способах проветрить голову

Не покупайте эти помои даже по акции: Роскачество назвало марки кофе, которые лучше избегать

Музыкальные новости

Концерт «Моцарт и Глинка» в Тригорском завершит «Летние вечера»

US Open. Рублев сыграет первым запуском на Арене Артура Эша, Гауфф – вторым, Соболенко последним на Арене Луи Армстронга

«Зенит» обновил программу // Лусиано Гонду сделал дубль в первом матче за клуб из Санкт-Петербурга

Уехала жить в Лондон: Лепс рассказал об отношениях с невестой на расстоянии

Прогулки по Москве

Российская певица Ольга Шультайс стала трижды титулованной королевой на Миссис Бизнес Москва’24

Теплую осень прогнозируют россиянам синоптики

"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

В регионах Центральной России росгвардейцы приняли участие в мероприятиях, приуроченных к началу нового учебного года

Определился соперник ЦСКА по финалу Кубка мэра Москвы

Недельная проверка содержания дворов прошла в Подмосковье

Собянин: силы ПВО сбили в Подольске летевший на Москву беспилотник

Дептранс Москвы сообщил о затруднении движения на улице Беговой из-за ДТП

Прогулки по Москве

Источник 360.ru: Mercedes влетел в столб в Москве, пострадал один человек

Источник 360.ru: в Бибирево водитель Hyundai сбил подростка на переходе

Не мытьём, так катанием: Турция стремится сохранить контроль над захваченной частью Сирии

Путин: Россия будет наращивать взаимовыгодные связи с Киргизией

Geo: мимо Запада благодаря Путину проходят тонны золота

Учебный год без вреда. Советы родителям школьников от московских врачей

График работы некоторых центров московского долголетия изменится с первого дня осени

Собянин: В Москве провели уникальную операцию на легочной артерии у детей

Болезнь кошачьих царапин: что это такое и как обезопасить себя и питомца

Определился соперник ЦСКА по финалу Кубка мэра Москвы

Metaratings: «Динамо» интересуется Тикнизяном

"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Прогулки по Москве

Лукашенко заявил о целях расширить сотрудничество с Киргизией

Сергей Собянин. Главное за день

Собянин: В Москве провели уникальную операцию на легочной артерии у детей

Собянин: БПЛА сбили на подлете к Москве в городском округе Подольск

Собянин: силы ПВО сбили в Одинцове четвертый БПЛА, летевший в сторону Москвы

Москва представила аналитическое исследование ...

Реализацию Москвой целей устойчивого развития обсудили на международном муниципальном форуме БРИКС

В Греции произошла экологическая катастрофа: известный порт заполнился мёртвой рыбой

Экология, медицина, отдых: Москвичам рассказали, как в городе создают комфортную среду

Красота православных храмов (#458)

Прибытие шести авиарейсов в Томск задерживается в воскресенье

Дело возбудили после пожара в Подмосковье, где погибли трое детей

В Новосибирске на форуме «Технопром-2024» завершился открытый кубок Сибири по битве мини-роботов.

В Арктике разворачивается «гонка вооружений». США пытаются препятствовать сотрудничеству РФ и КНР

Ревнивый муж залил зеленкой бывшего мэра Архангельска на съемках фильма

Близкая Арктика: что посмотреть в Архангельской области

Снайперы из Пскова научились поражать цели на сверхдальних расстояниях

Людей чудом не оказалось на остановке, в которую влетела BMW

В Симферополе устроят семейный фестиваль «До свидания, лето!»

В ДТП под Симферополем погибли два человека

Художник из Симферополя Виктор Нефедов создаст в Нальчике граффити на площади 260 квадратных метров

Красота православных храмов (#458)

В Новосибирске на форуме «Технопром-2024» завершился открытый кубок Сибири по битве мини-роботов.

Цены взлетят на 40% — какие продукты резко подорожают в сентябре в магазинах

В Гидрометцентре спрогнозировали до +31 градуса в Москве 1 сентября

Спорт в России и мире

Новости спорта

Новости тенниса
Анастасия Потапова

Российская теннисистка Потапова проиграла в матче третьего круга US Open

Прибытие шести авиарейсов в Томск задерживается в воскресенье

«Довели до панических атак»: шеф-повар из Ставрополя — о закулисье «Адской кухни»

Напавшие на свадебный автобус в Подмосковье оказались из охраны бизнесмена

Явилась во сне, чтобы защитить: как иконы меняли ход истории и спасали страну от захватчиков