Добавить новость
ru24.net
News in English
Ноябрь
2024

AI that mimics human problem solving is a big advance – but comes with new risks and problems

0
Anggalih Prasetya / Shutterstock

OpenAI recently unveiled its latest artificial intelligence (AI) models, o1-preview and o1-mini (also referred to as “Strawberry”), claiming a significant leap in the reasoning capabilities of large language models (the technology behind Strawberry and OpenAI’s ChatGPT). While the release of Strawberry generated excitement, it also raised critical questions about its novelty, efficacy and potential risks.

Central to this is the model’s ability to employ “chain-of-thought reasoning” – a method similar to a human using a scratchpad, or notepad, to write down intermediate steps when solving a problem.

Chain-of-thought reasoning mirrors human problem solving by breaking down complex tasks into simpler, manageable sub-tasks. The use of scratchpad-like reasoning in large language models is not a new idea.

The ability to perform chain-of-thought reasoning by AI systems not specifically trained to do so was first observed in 2022 by several research groups. These included Jason Wei and colleagues from Google Research and Takeshi Kojima and colleagues from the University of Tokyo and Google.

Before these works, other researchers such as Oana Camburu from the University of Oxford and her colleagues investigated the idea of teaching models to generate text-based explanations for their outputs. This is where the model describes the reasoning steps that it went through in order to produce a particular prediction.

Even earlier than this, researchers including Jacob Andreas from the Massachusetts Institute of Technology explored the idea of language as a tool for deconstructing complex problems. This enabled models to break down complex tasks into sequential, interpretable steps. This approach aligns with the principles of chain-of-thought reasoning.

Strawberry’s potential contribution to the field of AI could lie in scaling up these concepts.

A closer look

Although the exact method used by OpenAI for Strawberry is shrouded in mystery, many experts think that it uses a procedure known as “self-verification”.

This procedure improves the AI system’s own ability to perform chain-of-thought reasoning. Self-verification is inspired by how humans reflect and play out scenarios in their minds to make their reasoning and beliefs consistent.

Most recent AI systems based on large language models, such as Strawberry, are built in two stages. They first go through a process called “pre-training”, where the system acquires its basic knowledge by running through a large general dataset of information.

Chain-of-thought reasoning has similarities with the way people write down intermediate steps on a notepad when solving a problem. Earth Phakphum/Shutterstock

They can then undergo fine-tuning, where they are taught to perform specific tasks better, typically by being provided with additional, more specialised data.

This additional data is often curated and “annotated” by humans. This is where a person provides the AI system with additional context to aid its understanding of the training data. However, Strawberry’s self-verification approach is thought by some to be less data-hungry. Yet, there are indications that some of the o1 AI models were trained on extensive examples of chain-of-thought reasoning that have been annotated by experts.

This raises questions about the extent to which self-improvement, rather than expert-guided training, contributes to its capabilities. In addition, while the model may excel in certain areas, its reasoning proficiency does not surpass basic human competence in others. For example, versions of Strawberry still struggle with some mathematical reasoning problems that a capable 12-year-old can solve.

Risks and opacity

One primary concern with Strawberry is the lack of transparency surrounding the self-verification process and how it works. The reflection that the model performs upon its reasoning is not available to be examined, depriving users of insights into the system’s functioning.

The “knowledge” relied upon by the AI system to answer a given query is not available for inspection either. This means there is no way to edit or specify the set of facts, assumptions, and deduction techniques to be used.

Consequently, the system may produce answers that appear to be correct, and reasoning that appears sound, when in fact they are fundamentally flawed, potentially leading to misinformation.

Finally, OpenAI has built in protections to prevent undesirable uses of o1. But a recent report by OpenAI, that evaluates the system’s performance, did uncover some risks. Some researchers we have spoken to have shared their concerns, particularly regarding the potential for misuse by cyber-criminals.

The model’s ability to intentionally mislead or produce deceptive outputs – outlined in the report – adds another layer of risk, emphasising the need for stringent safeguards.

The authors do not work for, consult, own shares in or receive funding from any company or organisation that would benefit from this article, and have disclosed no relevant affiliations beyond their academic appointment.




Moscow.media
Частные объявления сегодня





Rss.plus



В Подмосковье сотрудники Росгвардии задержали гражданку, находившуюся в федеральном розыске

В Подмосковье сотрудники Росгвардии задержали гражданку, находившуюся в федеральном розыске

Лучшие студенческие энергетические отряды «Россети Центр» и «Россети Центр и Приволжье» награждены в Москве

Токсиколог Кутушов перечислил топ-5 наиболее токсичных веществ в бытовой химии


Спектакль- концерт «Владимир Высоцкий. Известный и неизвестный» в день его рождения пройдет в Петербурге

Уссурийский дизельный дивизион Желдорреммаш освоил новый вид продукции

Токсиколог Кутушов перечислил топ-5 наиболее токсичных веществ в бытовой химии

Хейли Бибер вышла на связь после слухов о разладе с Джастином: фото


What to know before Stanford visits SJSU for Bill Walsh Legacy Game

Lucas County Dogs for Adoption: 11/28

Derek Chisora unveils plan for shock career change once he’s retired from boxing – but plans dream 50TH fight first

The Evolution of Graphic Design: What Today’s Designers Offer


На Волге...

Hybrid разработал Creative Craft — продукт для генерации креативов с помощью технологий ИИ

*Meta (*Facebook) проложит подводный интернет-кабель между материками

В Москве раскрыто убийство предпринимателя в 2001 году


Riot is flexing its anticheat Vanguard by placing a bounty of up to $100,000 for anyone brilliant enough to find and report gaps in the system

Meet weird avians, save a kidnapped goddess, and explore a gorgeous lantern world inspired by Persian art in this very funny new indie adventure game

Plug In Digital перевыпустит Serial Cleaner на iOS и Android

Suicide Squad: Kill the Justice League is $3.50 on Steam, letting you poke around one of 2024's most interesting failures for the price of a cheeseburger


Секретар Миколаївської міськради у робочий час у нетверезому стані рекламував свій бізнес


Ядовитая красота: врач Кутушов рассказал о скрытых рисках искусственных елок

Секреты мотивации: как превратить рутину в увлекательный процесс

Токсиколог Кутушов перечислил топ-5 наиболее токсичных веществ в бытовой химии

Дышите глубже: доктор Кутушов рассказал, как "безопасные" альтернативы сигарет отравляют ваш организм




Секс-работницы в Бельгии получили право на пенсию

Time to Cashmere

Матвиенко: для контактов с американским парламентом нет никаких условий

Лучшие студенческие энергетические отряды «Россети Центр» и «Россети Центр и Приволжье» награждены в Москве


В каких театрах Москвы можно посмотреть спектакль-сказку «Щелкунчик»

«Зависимость от импортных комплектующих — отсутствует». В Москве представили тактический пикап АГ34

Где посмотреть «Щелкунчика». Знаменитая сказка в пяти театрах Москвы

Рабочий погиб в результате падения с высоты 42-го этажа в Кутузовском проезде


WTA сообщила Зарине Дияс плохую новость

Шнайдер: договорились с Андреевой играть весь сезон вместе на ТБШ и WTA 1000

WTA сделала заявление об отстранении второй ракетки мира

Хачанов намерен вернуться в топ-10 рейтинга ATP в следующем году


Секс-работницы в Бельгии получили право на пенсию

Джонни Деппа заподозрили в романе с моделью на фоне возвращения Юлии Власовой в Москву

Арктика превращается в поле битвы за ресурсы в глобальной борьбе

Баскетбольный ЦСКА выиграл у «Самары» в матче Единой лиги ВТБ


Музыкальные новости

Продвижение Музыки. Продвижение Песен. Раскрутка Песни.

Сергей Шнуров запретил Ксении Собчак слушать его новый альбом: как отреагировала журналистка?

Интересные каналы в Telegram. Лучшие каналы в Telegram.

Токсиколог Кутушов объяснил, как лапша быстрого приготовления подрывает иммунитет



Секреты мотивации: как превратить рутину в увлекательный процесс

Дышите глубже: доктор Кутушов рассказал, как "безопасные" альтернативы сигарет отравляют ваш организм

Лучшие студенческие энергетические отряды «Россети Центр» и «Россети Центр и Приволжье» награждены в Москве

Ядовитая красота: врач Кутушов рассказал о скрытых рисках искусственных елок


Интересные каналы в Telegram. Лучшие каналы в Telegram.

Time to Cashmere

Футболисты "Спартака" встретятся с "Акроном" в 1/4 финала "пути регионов" Кубка России

Ким Чен Ын: Северная Корея всегда будет на стороне России


Алексей Тузов для Известий: Эксперт спрогнозировал рост цен на авто из-за увеличения утилизационного сбора

Несколько автомобилей столкнулись в Лефортовском тоннеле в Москве

Человек погиб в ДТП с грузовиками в Новой Москве

Первая Снежная Битва Под Бородино


Путин передал часть функций по развитию фонда "Сколково" властям Москвы

Путин посетит Минск

Путин уточнил порядок прохождения контроля транспортных средств

Посол ФРГ назвал основную мысль Шольца в телефонном разговоре с Путиным





Враги или союзники? Доктор Кутушов объяснил, когда отказ от молочных продуктов и глютена оправдан

Токсиколог Кутушов перечислил топ-5 наиболее токсичных веществ в бытовой химии

Секреты мотивации: как превратить рутину в увлекательный процесс

Ядовитая красота: врач Кутушов рассказал о скрытых рисках искусственных елок


Захарова: Зеленского предали хозяева

Ͷтaльянcκaя жуpнaлиcтκa: Ƃeɜумиe Ƃaйдeнa cтaвит пοд угpοɜу вcё чeлοвeчecтвο. Зaпaдныe cтpaны нe гοтοвы κ вοйнe в cвοём дοмe

Новые лидеры ЕС первым делом примчались в Киев: Утешили Зеленского и пожурили Трампа


Гран-при за танец, ставший эталоном

"Спартак" нанес разгромное поражение "Краснодару" в матче РПЛ

Первая Снежная Битва Под Бородино

Кубок России (жен). 1/2 финала. «Ленинградка» на тай-брейке уступила московскому «Динамо», «Динамо» из Казани встретится с «Локомотивом»




Собянин назвал социальные объекты, которые инвесторы строят при поддержке Москвы

Сергей Собянин объявил о начале приема заявок на архитектурную премию Москвы

Собянин: 6 спорткомплексов с ледовыми катками откроются в Москве до конца 2026 года


Ядовитая красота: врач Кутушов рассказал о скрытых рисках искусственных елок

Представлен отечественный снегоболотоход «Егерь» c мотором от Hyundai Galloper и Hyundai H1

Вадим Петров поздравил ВООП со 100-летием и предложил новую парадигму восстановления экосистем

Вешенка, дрожалка, булгария: какие грибы можно встретить в Москве зимой


В парках Москвы пройдет проект для фигуристов-любителей «Народный Ледниковый»

Арктика превращается в поле битвы за ресурсы в глобальной борьбе

В России учредили премии за достижения в детской и подростковой литературе


Школьники из Архангельской области – в числе победителей и призеров Национальной технологической олимпиады Junior

В Архангельске определили чемпионов Поморья по настольному теннису

Декабрь спрогнозировали россиянам синоптики

В Архангельске представили выставку «Мечта о Севере. Снегурочка»


«Динамика будет сдержанной». Пока где-то «вторичка» дорожает, в Симферополе она дешевеет, но это не точно

«Жить стало лучше, жить стало веселее». Севастополь и Симферополь - в лидерах российского рейтинга по уровню жизни в 2024 году

В рейтинге качества жизни российских городов Ростов обвалился сразу на 17 мест

В России массово воруют масло: за неделю заведено около 50 дел


Девелопер небоскребов указал на популярность квартир с панорамными видами среди россиян

Орловцы «отправили» губернатора Клычкова на повышение в Москву

Новые правила для иностранцев: биометрия при въезде в Россию

В Подмосковье открылась фотовыставка «Мы вместе»












Спорт в России и мире

Новости спорта


Новости тенниса
WTA

WTA сделала заявление об отстранении второй ракетки мира






Ипотека перебралась на вторичный рынок

«А экран-то зачем?» Могли ли товарищи Жеглова высмеивать Гришу «6 на 9»

Арктика превращается в поле битвы за ресурсы в глобальной борьбе

«Как ребенка вынашивали». Глава Кулундинского района рассказал, как получить миллионы на развитие села