Добавить новость
ru24.net
News in English
Август
2024
1 2 3 4 5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Inbred, gibberish or just MAD? Warnings rise about AI models

0
Inbred, gibberish or just MAD? Warnings rise about AI models

The Habsburgs were one of Europe's most powerful royal houses, but entire sections of their family line collapsed after centuries of inbreeding.

Recent studies have shown how AI programs underpinning products like ChatGPT go through a similar collapse when they are repeatedly fed their own data.

"I think the term Habsburg AI has aged very well," Sadowski told AFP, saying his coinage had "only become more relevant for how we think about AI systems".

The ultimate concern is that AI-generated content could take over the web, which could in turn render chatbots and image generators useless and throw a trillion-dollar industry into a tailspin.

But other experts argue that the problem is overstated, or can be fixed.

And many companies are enthusiastic about using what they call synthetic data to train AI programs. This artificially generated data is used to augment or replace real-world data. It is cheaper than human-created content but more predictable.

"The open question for researchers and companies building AI systems is: how much synthetic data is too much," said Sadowski, lecturer in emerging technologies at Australia's Monash University.

'Mad cow disease'

Training AI programs, known in the industry as large language models (LLMs), involves scraping vast quantities of text or images from the internet.

This information is broken into trillions of tiny machine-readable chunks, known as tokens.

When asked a question, a program like ChatGPT selects and assembles tokens in a way that its training data tells it is the most likely sequence to fit with the query.

But even the best AI tools generate falsehoods and nonsense, and critics have long expressed concern about what would happen if a model was fed on its own outputs.

In late July, a paper in the journal Nature titled "AI models collapse when trained on recursively generated data" proved a lightning rod for discussion.

The authors described how models quickly discarded rarer elements in their original dataset and, as Nature reported, outputs degenerated into "gibberish".

A week later, researchers from Rice and Stanford universities published a paper titled "Self-consuming generative models go MAD" that reached a similar conclusion.

They tested image-generating AI programs and showed that outputs become more generic and strafed with undesirable elements as they added AI-generated data to the underlying model.

They labelled model collapse "Model Autophagy Disorder" (MAD) and compared it to mad cow disease, a fatal illness caused by feeding the remnants of dead cows to other cows.

'Doomsday scenario'

These researchers worry that AI-generated text, images and video are clearing the web of usable human-made data.

"One doomsday scenario is that if left uncontrolled for many generations, MAD could poison the data quality and diversity of the entire internet," one of the Rice University authors, Richard Baraniuk, said in a statement.

However, industry figures are unfazed.

Anthropic and Hugging Face, two leaders in the field who pride themselves on taking an ethical approach to the technology, both told AFP they used AI-generated data to fine-tune or filter their datasets.

Anton Lozhkov, machine learning engineer at Hugging Face, said the Nature paper gave an interesting theoretical perspective but its disaster scenario was not realistic.

"Training on multiple rounds of synthetic data is simply not done in reality," he said.

However, he said researchers were just as frustrated as everyone else with the state of the internet.

"A large part of the internet is trash," he said, adding that Hugging Face already made huge efforts to clean data -- sometimes jettisoning as much as 90 percent.

He hoped that web users would help clear up the internet by simply not engaging with generated content.

"I strongly believe that humans will see the effects and catch generated data way before models will," he said.




Moscow.media
Частные объявления сегодня





Rss.plus



Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Обращение иерея Александра Туховского

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества


Школьная коллекция Smena осень-зима 2024

Губернатор Оренбургской области Денис Паслер посетил Оренбургский ЛРЗ Желдорреммаш в рамках празднования Дня железнодорожника

Карточка Артиста.

Алексей Фомин представил новый трек «Лунный свет»


India face first defeat in hockey at Paris Olympics against Belgium

Man Utd 0 Liverpool 3: Red Devils will hope £36.5m Joshua Zirkzee will have an impact as Prem rivals run riot in US

Latest Caleb Williams Buzz Indicates The Light Bulb Just Went On

Rewards Drive Mobile Wallet Use for One-Third of eCommerce Shoppers


"Чайф", БАЭС, "Оленьи ручьи": что станет достоянием Среднего Урала?

В ВМС Британии схватились за голову: В 2021-м ПО для их подлодок писали русские, которые могли украсть все секреты и понаставить жучков

Выяснилось, жители каких регионов могут купить больше всего бензина на свою зарплату

Торжок


Don't expect Dragon Age: The Veilguard before October at the absolute earliest

Новый трейлер Titan Quest 2 и страница в Steam

Началась предзагрузка Sword of Convallaria на iOS и Android

Ранняя версия Summon and Merge 2 доступна в Google Play 1 страны


Міжнародна академія PROeffect Academy запрошує


Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Обращение иерея Александра Туховского

Рустэм Султанов возродил в «Звёздном доме» традиции космического поп-рока

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества




Хиромант рассказал об особенностях науки дерматоглифики

Посетить концерт k-pop-бэнда BLITZERS смогут гости «Фандом Феста» в Москве

Обращение иерея Александра Туховского

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года


Подмосковная служба помощи при ДТП приняла свыше 2 тысяч звонков за неделю

Мужчина сделал пересадку на самолет, просто найдя его на летном поле

Более 600 человек приняли участие в Фестивале казачьих боевых искусств и культуры

Параспортсмены из Химок стали чемпионами России по академической гребле


Рахимова поднялась на 12 строчек в рейтинге WTA, Павлюченкова вернулась в топ‑30

Азаренко вышла в ¼ финала турнира WTA-500 в Вашингтоне

Олимпиада в Париже. Новак Джокович впервые в карьере выигрывает золото Игр

Даниил Медведев и Андрей Рублев сохранили позиции в рейтинге ATP


Более 600 человек приняли участие в Фестивале казачьих боевых искусств и культуры

Параспортсмены из Химок стали чемпионами России по академической гребле

Подмосковная служба помощи при ДТП приняла свыше 2 тысяч звонков за неделю

Более 30 км трассы А-107 ММК в Подмосковье отремонтировали


Музыкальные новости

Оксана Самойлова показала, как она с детьми поздравила Джигана с 39-летием: «Пол-острова лично для него»

Певица Алла Пугачева планирует вернуться в Москву до конца лета

Сергей Лазарев сравнил нижегородскую певицу с Машей Распутиной

Беременная Карди Би публично защитила Оффсета, с которым разводится: «Он очень мне помогает»



Обращение иерея Александра Туховского

Рустэм Султанов возродил в «Звёздном доме» традиции космического поп-рока

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества

Итоги в цифрах


На трассе «Калининец» прошел очередной этап Чемпионата и Первенства Москвы и МО по кроссу Кубок Kramar Motorsport

Что там в IT: смерть YouTube в России, падение Intel и GPT-поиск от OpenAI

CNN сообщило о роли Харрис в обмене заключенными с Россией

Пожар в супермаркете на юге Москвы потушили на площади 100 квадратных метров


Новые BelGee X50 появились в автопарке каршеринга BelkaCar

Кировская область стала вторым регионом страны по темпам роста цен на бензин

«Авто Года» установил рекорд России по самому продолжительному непрерывному движению на автомобиле

Доля КАМАЗа на российском рынке электробусов достигла 96%


Ким Чен Ын не исключил обращения к Москве за помощью из-за наводнения

В годовщину трагедии Хиросимы в Японии обвинили Москву в угрозе применения ядерного оружия

Россия и Запад повторяют кризис 1985-1987 годов, только чем он закончится теперь – договором, как в тот раз, или войной?





Mash: в клинике «Эталон» мужчине повредили мозг во время пластической операции

Аналитприбор монооксида углерода выдыхаемого воздуха - в списке оснащения кабинетов врачей

Главный нарколог Москвы Масякин перечислил критерии алкогольной зависимости

Главный нарколог Москвы Масякин назвал критерии алкогольной зависимости



На трассе «Калининец» прошел очередной этап Чемпионата и Первенства Москвы и МО по кроссу Кубок Kramar Motorsport

Дети и подростки стали главными участниками чемпионата «Камень, ножницы, бумага»

Спортсмен из Росгвардии стал бронзовым призером Кубка России по спортивной гимнастике в Новосибирске

Росгвардейцы обеспечили безопасность на футбольном матче «ЦСКА» - «Оренбург» в Москве




Собянин открыл московский городской вокзал «Митьково»

Сергей Собянин рассказал о реставрации московских театров

Сергей Собянин: Реконструкция Сельскохозяйственной улицы завершится в 2025 году

Собянин рассказал о реставрации московских театров


Эксперт Елисеев назвал причину частого появления радуги в Москве

Ким Чен Ын не исключил обращения к Москве за помощью из-за наводнения

«Группа компаний «ДАФ» подарила Кашире десять контейнеров для раздельного сбора мусора

Пресня станет зеленее


Москва 24 и «Московское долголетие» приглашают на кастинг

Подмосковная служба помощи при ДТП приняла свыше 2 тысяч звонков за неделю

СМИ: певец SHAMAN предсказал победу России в ходе недавнего митинга

Более 600 человек приняли участие в Фестивале казачьих боевых искусств и культуры


Пропавшую под Архангельском двухлетнюю девочку нашли живой в болоте

Премьера пространственной симфонии состоялась в Архангельской области

Пять наград завоевали юные туристы из Кемерова на Всероссийском слёте

Собянин: Начался монтаж щита-гиганта для прокладки Рублево-Архангельской линии


Цена квадратного метра в Севастополе упала, в Симферополе держится

Выставка-портрет «Мастер исторического и портретного жанра»

В путь-дорогу: подборка полезных мобильных приложений для водителей

Жизнь замечательных людей Крыма. Евгений Веремеенко


СМИ: певец SHAMAN предсказал победу России в ходе недавнего митинга

"Рен ТВ": суд признал законным административный арест блогера Эдварда Била

Производство стройматериалов откроют на земле за 1 рубль в Богородском округе

Мужчина сделал пересадку на самолет, просто найдя его на летном поле












Спорт в России и мире

Новости спорта


Новости тенниса
Новак Джокович

Теннисист Джокович впервые в карьере выиграл золото на Олимпиаде






Инна Святенко встретилась с молодежью в формате «ПолитПикник»

Biogen подала иск против «Генериума» из-за российского аналога «Спинразы»

Неделя в Москве: сады и люди, диафильмы и фестиваль Максима Горького

Москва 24 и «Московское долголетие» приглашают на кастинг