Добавить новость
ru24.net
Eldiario.es
Июль
2024

Las inteligencias artificiales "colapsan" si se quedan sin obras humanas de las que aprender

0

Un estudio publicado en Nature avisa de que los sistemas entrenados por contenidos generados por otras inteligencias artificiales "pierden la percepción de la realidad"

La curva de aprendizaje de la inteligencia artificial está en riesgo: su ansia de datos es infinita pero no las obras humanas

La revolución de la inteligencia artificial apenas acaba de comenzar. Sin embargo, ya se ha encontrado con un obstáculo en el camino que amenaza el desarrollo potencial de la tecnología: la disponibilidad limitada de obras humanas de las que aprender. Estos sistemas necesitan analizar grandes cantidades de datos, de los que extraen patrones que les permiten generar su propio contenido, ya sea texto, imagen o vídeo. Cuanta más diversa es esa información, mejor será su capacidad de generalizar o hacer predicciones complejas.

El problema es que se sabe que empresas como OpenAI ya han utilizado todos los datos de alta calidad disponibles de forma pública en la red para entrenar modelos como ChatGPT. Su necesidad de seguir suministrando información a su máquina para que esta sigan mejorando ha provocado que recurra a datos de menos calidad, como lo de las redes sociales (YouTube la ha acusado de transcribir y volcar a sus bases de datos los vídeos de su plataforma, algo que prohíben sus términos de servicio) o a aquellos protegidos con derechos de autor (OpenAI ha reconocido que si hubiera respetado el copyright, habría sido “imposible” entrenar a ChatGPT).

Para evitar este tipo de charcos la industria lleva tiempo trabajando sobre una idea: ¿si los contenidos generados por inteligencia artificial tienen sentido y son técnicamente material nuevo, por qué no utilizarlos en el entrenamiento de nuevas inteligencias artificiales? Información creada por máquinas para que las máquinas puedan seguir aprendiendo. El sector los llama “datos sintéticos” y ahora mismo representan su gran esperanza de poder seguir mejorando exponencialmente los sistemas de IA sin frenar su curva de aprendizaje.

Un buen número de expertos han expresado dudas acerca de la idea por la posibilidad de que estos sistemas se conviertan en gigantescas piscinas de conocimiento endogámico, exagerando cada vez más los errores que separan a los sistemas automáticos de las creaciones humanas. Ahora, un nuevo estudio publicado Nature les da la razón. “Descubrimos que el uso indiscriminado de contenido generado por modelos en el entrenamiento causa defectos irreversibles en los modelos resultantes”, alertan los investigadores: “Nos referimos a este efecto como 'colapso del modelo'”.

“Colapso del modelo”

El estudio está firmado por investigadores de las universidades de Oxford, Cambridge, el Imperial College de Londres y del Instituto Vector de Canadá. Han analizado qué ocurriría si los datos sintéticos empiezan a tener un peso importante en el corpus de entrenamiento de cada nueva IA, algo que de momento no ocurre pero podría llegar mucho más pronto de lo esperado. El motivo es que los contenidos generados artificialmente están expandiéndose por Internet muy rápido, llenando ya páginas y páginas de contenido en formato texto así como audiovisual en redes sociales.

Si los nuevos modelos de IA se siguen entrenando con recursos públicos de Internet empezarán a canibalizar sus propias creaciones, “contaminando” con datos sintéticos su corpus de entrenamiento. El resultado será ese “colapso” del que avisan los investigadores: “Al ser entrenados con datos contaminados, entonces perciben erróneamente la realidad”. Pierden diversidad, repiten cada vez más elementos o frase y su capacidad para manejar situaciones nuevas o no anticipadas en su entrenamiento disminuye drásticamente.

Finalmente se llega a un circulo vicioso, “un proceso de aprendizaje degenerativo en el que los modelos comienzan a olvidar eventos improbables con el tiempo, a medida que el modelo se envenena con su propia proyección de la realidad”.

Los datos humanos, cada vez más valiosos

El estudio señala varias consecuencias de sus hallazgos. La primera es que “la ventaja del primero que llega” es aún más notoria, ya para las empresas que comenzaron a entrenar sus modelos de IA antes que la red empezara a llenarse de contenidos generados artificialmente será más sencillo impedir el envenenamiento de sus modelos.

La segunda es la importancia de los datos generados por humanos. “El valor de los datos recopilados sobre interacciones humanas genuinas con los sistemas será cada vez más valioso en presencia de contenido generado por inteligencias artificiales en datos extraídos de Internet”, destacan los investigadores.

En las últimas semanas ha habido sendas muestras del valor creciente de esos datos. Meta ha sido amonestada por las autoridades de protección de datos de la UE por tratar de utilizar los comentarios y fotografías publicadas por los usuarios de Facebook e Instagram sin avisarlos adecuadamente. Su objetivo era entrenar una nueva inteligencia artificial multipropósito. La empresa ha terminado renunciando a usar los datos de los europeos, pero en contrapartida no permitirá que su IA se utilice en territorio europeo.

Elon Musk ha realizado un movimiento similar. El dueño de Twitter (ahora renombrada a X) ha introducido sin avisar una nueva opción en la que el usuario acepta entrar a su IA, Grok, con los datos que genera en la red social. “Para mejorar continuamente tu experiencia, podemos utilizar tus posts en X, así como tus interacciones, entradas y resultados como usuario con Grok para fines de entrenamiento y perfeccionamiento. Esto también significa que tus interacciones, entradas y resultados pueden compartirse con nuestro proveedor de servicio xAI con dichos fines”, avisa en una casilla que viene marcada por defecto. Puede desactivarse en este enlace.

La jugada de Musk ha salido a la luz en los últimos días y varios abogados especialistas en protección de datos han avisado que puede contravenir la legislación europea. La autoridad de privacidad irlandesa, de la que depende la red social comprada por el multimillonario, ya ha anunciado que está investigando el asunto.




Moscow.media
Частные объявления сегодня





Rss.plus



«Я чувствую вашу любовь!» – SHAMAN спел для слушателей «Авторадио»

Сотрудники Росгвардии задержали нетрезвого водителя в подмосковных Люберцах

Сотрудники Росгвардии задержали нетрезвого водителя в подмосковных Люберцах

Филиал № 4 ОСФР по Москве и Московской области информирует: 2,5 млн жителей Москвы и Московской области получили пособия по временной нетрудоспособности с начала 2024 года


Anex сделал заявление о вылетах в Хургаду и Шарм-эль-Шейх из различных городов России

Сегодня жители района Перово смогут посетить концерт и мастер-классы от Культурного центра «Интеграция»

От высокого холестерина спасут яблоки? Врач объяснила, можно ли заменять статины на продукты и пищевые добавки

Сотрудники «Маринс Гранд Отель Астрахань» оказали помощь фонду «Елизаветинский»


Barron Trump’s College Decision Revealed as He Shows Up for First Day of Classes Flanked by Secret Service

Jimmy Fallon plans to tape his mouth shut for a better night's sleep

JESSE WATTERS: No one is really voting for Kamala Harris

Watch Real Madrid star Tchouameni’s bizarre ‘Fifa glitch’ tackle as optical illusion leaves fans completely baffled


Начался второй этап реконструкции автодороги Средние Ачалуки - Плиево в Ингушетии

Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Филиал № 4 ОСФР по Москве и Московской области информирует: 2,5 млн жителей Москвы и Московской области получили пособия по временной нетрудоспособности с начала 2024 года


Spectre Divide launches with outrageous $90 gun skins out the gate, which only makes its broken matchmaking more annoying

1 млн предрегистраций на Nigoriri Angels on Stage и релиз на этой неделе

Risk of Rain 2 creators weigh in on Gearbox's first DLC without them: 'It's great to see new content for the game, but it's hard to see growing pains of the new team in real time'

Court locks in Bungie's $4.4 million win against Destiny 2 cheat maker, refuses request for a new trial



Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам

Вильфанд: 5 сентября установлен рекорд атмосферного давления в Москве

Филиал № 4 ОСФР по Москве и Московской области информирует: 2,5 млн жителей Москвы и Московской области получили пособия по временной нетрудоспособности с начала 2024 года

Новый сезон откроет постановка китайского режиссера




Гендиректор «Спартака» обрадовался переходу Промеса в «Дубай»: «Правильное окружение»

«Я чувствую вашу любовь!» – SHAMAN спел для слушателей «Авторадио»

Сотрудники Росгвардии задержали нетрезвого водителя в подмосковных Люберцах

Новый сезон откроет постановка китайского режиссера


Как Россия воплотит африканскую мечту о технологическом суверенитете

Российская пловчиха Павлова завоевала золото Паралимпиады-2024 с мировым рекордом

Программу «Мама-предприниматель» запустят в Подмосковье в сентябре

В НИУ МЭИ создали энергоустановку с использованием бионических технологий


Александр Зверев квалифицировался на Итоговый турнир ATP

Четвертая ракетка мира Зверев не смог пробиться в полуфинал US Open

Медведев о матче с Синнером: «Постараюсь больше думать об «Уимблдоне», чем об Australian Open»

Теннисист Медведев обыграл Боржеша и вышел в 1/4 финала US Open


Борцы из Подмосковья получили 2 бронзовые медали на соревнованиях в Испании

На Московской международной книжной ярмарке покажут сериалы «ЯРКО»

"Аэрофлот" открыл рейсы на Хайнань из регионов России

В Карелии арестовали бизнесмена, виновного в отравлении 80 человек


Музыкальные новости

Shaman поблагодарил поклонников: «Я чувствую вашу любовь!»

Владимир Спиваков и НФОР отправятся на гастроли в Венгрию

СМИ: В Ростове обокрали спортивного директора футбольного клуба Басты

Моргенштерн* психически нездоров и лечится: «Я признал свою болезнь, зависимости»



Филиал № 4 ОСФР по Москве и Московской области информирует: 2,5 млн жителей Москвы и Московской области получили пособия по временной нетрудоспособности с начала 2024 года

Новый сезон откроет постановка китайского режиссера

Вильфанд: 5 сентября установлен рекорд атмосферного давления в Москве

Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам


Работники СЛД «Магдагачи» филиала «Забайкальский» компании «ЛокоТех-Сервис» организовали экологический десант

Сергей Собянин рассказал о задачах по повышению качества городской среды

Дистрибьюция Музыки.

"Спартак" победил ЦСКА в московском дерби на старте сезона КХЛ


Филиал № 4 ОСФР по Москве и Московской области информирует: Гражданам Москвы и Московской области, получившим тяжелые производственные травмы, выданы автомобили марки «Лада Гранта»

Автомобиль загорелся на внешней стороне 43-го километра МКАД

13 сентября в подмосковном Софрино состоится финал профессионального конкурса лесных служб России и Белоруссии «Лучший лесной пожарный 2024 года»

Дептранс Москвы: на внешней стороне 43-го км МКАД загорелся автомобиль


Путин про Дурова: "у России не было никаких претензий к нему"

Путин пошутил о выборах в США - обозначен "приоритетный" кандидат: "Видно, что всё у неё хорошо"

Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам

Во Франции требуют от Харрис объяснений после слов Путина о ее поддержке





Станислав Кондрашов подчеркивает важность этических аспектов применения ИИ в медицине

Как русский герой победил вирус

Серия концертов, сочетающих музыку, литературу и арт-терапию, пройдет в Культурном центре ЗИЛ в сентябре в рамках авторского проекта «П в кубе»

Более 20 выпускников медицинского класса в Коломне поступили в профильные вузы


«Никаких красных линий» – в Киеве признались в активном применении запрещённого оружия режимом Зеленского

Зеленский собрался клянчить оружие у группы «Рамштайн»

Зеленский разработал «план победы» над Россией и намерен представить его Байдену


Охрана труда под полным контролем

13 сентября в подмосковном Софрино состоится финал профессионального конкурса лесных служб России и Белоруссии «Лучший лесной пожарный 2024 года»

ТиНАО: самое важное за неделю

Экс-банкира Кононова приговорили к 12 годам за хищение денег у Радулова




Собянин: более 130 объектов украсит архитектурно-художественная подсветка

Сергей Собянин рассказал о развитии роботической хирургии в Москве

Сергей Собянин: Проводим комплексную модернизацию

Собянин: Москвичи направили на благотворительность почти 150 миллионов рублей


Завтракал на пляже. В Серебряном Бору встретили исчезающую птицу клинтух

Зеленый вектор: страны БРИКС уделяют все больше внимания экологии

13 сентября в подмосковном Софрино состоится финал профессионального конкурса лесных служб России и Белоруссии «Лучший лесной пожарный 2024 года»

На территории Южного округа Москвы прошли экорейды


ВЭФ-2024: Газпромбанк Лизинг подписал соглашение о сотрудничестве с АО «КАМА»

В Москве освободили от должности прокурора Попова

Прокурор Москвы Попов ушел в отставку по собственному желанию

Трамп: санкции США угрожают статусу доллара как мировой валюты


Путин: Россия намерена развивать университеты в Арктике и на Дальнем Востоке

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Дальнобойщик в Архангельской области зарабатывает 150 тыс. рублей в месяц

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный


Уголовное дело за дебош в поезде «Москва – Симферополь» возбудили в Воронеже

Вечер-аншлаг «Он жил, как песня, что длиною в жизнь»

Выставка крымского имени «Тайны души и творчества Алемдара Караманова»

Беседа – предостережение «Россия против террора!», ко Дню солидарности в борьбе с терроризмом.


Новый сезон откроет постановка китайского режиссера

Прокурор Москвы Попов ушел в отставку по собственному желанию

Программу «Мама-предприниматель» запустят в Подмосковье в сентябре

Минюст США обвинил модератора ПМЭФ-2023 Саймса в нарушении санкций












Спорт в России и мире

Новости спорта


Новости тенниса
Даниил Медведев

Матч Медведева и Боргеша на US Open прервали из-за пожарной тревоги






Программу «Мама-предприниматель» запустят в Подмосковье в сентябре

Минюст США обвинил модератора ПМЭФ-2023 Саймса в нарушении санкций

РАСКРЫТА ЗАГАДКА СЛОВ В.В.ПУТИНА ПРО КАМАЛУ ХАРРИС. СЕНСАЦИОННЫЕ ПОДРОБНОСТИ! И новости про Youtube в России, про "Посейдон Рэмыча" и другие очень важные данные!

Новый сезон откроет постановка китайского режиссера