Добавить новость
ru24.net
World News
Июль
2024

Entrenar a ChatGPT con datos producidos por máquinas hace que pierda la memoria

0
Abc.es 
ChatGPT es capaz de responder, prácticamente, a cualquier pregunta que le haga el usuario en cuestión de segundos. Sin embargo, la herramienta esta lejos (muchísimo) de ser plenamente confiable. Sam Altman , director ejecutivo de la empresa OpenAI, creadora de la máquina, lo sabe bien; por eso, siempre que tiene ocasión, recuerda a todo el que esté dispuesto a escuchar lo «tontas» que son las soluciones que crean texto e imágenes a partir de palabras a día de hoy. También alerta sobre los errores que cometen. Errores que, en muchos casos, son utilizados para entrenar directamente a los algoritmos que las mueven. Y eso es un problema que puede volverse mucho más grave en el futuro. De acuerdo con un estudio publicado en ' Nature ', el uso de datos generados directamente por inteligencia artificial para el entrenamiento de herramientas como ChatGPT puede provocar que estas colapsen y empiecen a errar a discreción en sus resultados, que se volverán, además, pobres y mucho más limitados. «Imaginemos a un estudiante que sólo estudia sus propios apuntes, copiados parcialmente de forma incorrecta de una pizarra, ignorando por completo el libro de texto de la clase y las lecciones correspondientes. Se convencería a sí mismo de que los errores son correctos y desarrollaría una sólida comprensión de sus propios errores», explica a ABC Ilia Shumailov , investigador de la Universidad de Oxford (Reino Unido) y autor principal del estudio. Shumailov destaca que, el alumno daría por buenos datos que son erróneos y muy limitados, y «algo similar ocurre aquí con los modelos (de IA)»: «Se convencen a sí mismos de que los errores son una fuente de verdad y que los acontecimientos probables son más importantes de lo que lo son en realidad». El auge de ChatGPT, y la llegada a la red de muchísimas soluciones de IA generativa similares, como es el caso de Gemini , de Google, o de Llama , de Meta, ha provocado que el número de contenido generado por inteligencia artificial que hay en internet aumente considerablemente durante los últimos meses. Es fácil entrar en páginas web y ver que las imágenes que las pueblan han sido creadas por máquinas, y lo mismo ocurre con los textos. El problema es que para crear todo este contenido, las máquinas son entrenadas previamente con información publicada a lo ancho y largo de internet, desde blogs hasta portales de noticias o redes sociales. Y dentro de la red, como hemos dichos, ahora, y cada vez más en el futuro, se encuentra también texto e imágenes generadas por IA, que ya están siendo empleadas activamente para capacitar a las herramientas, entre ellas ChatGPT . «Si observas los informes correspondientes a GPT , encontrarás que ya se utilizan algunos datos sintéticos durante el proceso de entrenamiento«, dice Shumailov. El estudio, efectivamente, sostiene que el uso de datos generados hace que las herramientas de IA colapsen, y esto lleva a que se vuelvan, con el tiempo, menos precisas en sus resultados, y, por tanto, que ofrezcan contenido cada vez más pobre y limitado. También que olviden los elementos menos comunes de sus datos de entrenamiento originales y se queden solo con aquello que ven de forma recurrente, como señala Emily Wenger, ingeniera informática de la Universidad de Duke, en un análisis del estudio. Wenger apunta que, por ejemplo, una herramienta que genera imágenes de perros tenderá a reproducir en sus resultados las razas más comunes respecto a los datos con los que ha sido entrenada. Por tanto, si se la capacita con mucha información sobre el golden retriever tenderá a olvidar a todos los demás. Y si futuros modelos se entrenan con datos generados por IA que representan mucho a este tipo concreto de perro, el problema se agravará. Con el tiempo, el modelo solo generará imágenes de esa clase colapsando en el proceso . «Cuando el contenido generado por IA se incluye en los conjuntos de datos que se usan para entrenar modelos, estos modelos aprenden a generar conceptos, frases y tonos bien conocidos más fácilmente que ideas y formas de escribir menos comunes. Este es el problema», zanja la ingeniera. Shumailov y sus colegas apuntan que hay medios de evitar que una máquina generadora de contenido colapse . «Hay varias formas posibles, aunque la literatura académica actualmente no tiene una comprensión clara de hasta qué punto serán útiles. En primer lugar, hay que verificar siempre los modelos a medida que se desarrollan, certificando explícitamente el desempeño de los datos minoritarios», apunta el investigador de Oxford. «En segundo lugar, hay que asegurarse de que los datos se filtren y de que no se incluyan puntos de datos incorrectos o corruptos en el desarrollo», prosigue. El estudio, efectivamente, aboga por la necesidad de que las empresas de desarrollo de IA, como OpenAI, desarrollen estrategias que mitiguen el impacto del colapso de sus herramientas para ayudar a que sean más precisas y efectivas con el paso del tiempo. Porque, además, la cantidad de contenido generado mediante inteligencia artificial disponible en la red no va a descender próximamente. Más bien todo lo contrario.



Moscow.media
Частные объявления сегодня





Rss.plus



Амбассадор фонда без кистей рук установил мировой рекорд в дисциплине стронгмен

С начала 2024 года более 2,5 тысячи многодетных мам в Московском регионе досрочно вышли на пенсию

В этом году Отделение СФР по Москве и Московской области компенсировало стоимость полиса ОСАГО 1 192 жителям региона

Более 6 миллионов жителей Московского региона выбрали электронные трудовые книжки


Michael Kors представил осеннюю рекламную кампанию

На позитиве и на постоянном движе! Концерты звезд «Авторадио» в «Музеоне»

Из океана - на Платт

Косметолог Мадина Байрамукова: какие процедуры стоит сделать после лета


Deontay Wilder Rules Out Incredible Comeback Fight Offer: “Not Interested”

Former Jamaica ace hopes new guide for mums in football leads to better support for female players with children

Eleven sensational Premier League transfers that could yet be done including huge deals for Man Utd and Chelsea

America ramps up hunt for Hamas boss Yahya Sinwar to try to stop all-out Middle East war


Житель Сургута поверил в байки о "расследовании ФСБ" и перевел мошенникам почти 14 миллионов рублей

«Я деньги зарабатывать приехал, здеся нравица»: таджика-уклонист не смог поверить, что у него забирают гражданство - видео.

ГАЗ начал продажи новой модели грузовика. Цена уже известна

Майское утро....


Super Farming Boy можно предзаказать через App Store

Dragon Age: The Veilguard is getting a prequel in the form of an audio drama podcast

INCUBO M: Horror Adventure появилась в Google Play

Starfield modders are already trading in Bethesda's new buggy for Halo's Warthog and Luke's landspeeder



Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ

В этом году Отделение СФР по Москве и Московской области компенсировало стоимость полиса ОСАГО 1 192 жителям региона

Более 6 миллионов жителей Московского региона выбрали электронные трудовые книжки

Социальный фонд оказывает помощь эвакуированным жителям Курской области




СМИ: Павел Дуров доставлен в суд

Подбор персонала через кадровое агентство: преимущества и особенности

Социальный фонд оказывает помощь эвакуированным жителям Курской области

Более 6 миллионов жителей Московского региона выбрали электронные трудовые книжки


Медведев исключил простое решение для миграционной проблемы в России

На МЦК запустили первый пассажирский поезд с автопилотом

Более 37 тыс пассажиров перевезли на Московской детской железной дороге за лето

В районе деревни Лобок отмечается увеличение пассажиропотока на российско-белорусской границе


Карен Хачанов поднялся на одну строчку в рейтинге ATP

Теннисист Рублев вышел во второй раунд US Open

Россиянин Рублев уверенно победил бразильца Уайлда на старте US Open

Анна Блинкова проиграла Эмме Наварро на старте Открытого чемпионата США


Владислав Шапша работает в Москве над новым нацпроектом «Кадры»

Маски с котиками: Влад А4 поделился забавным видео с дочерью

Четыре марки, посвящённые архитектуре Кавминвод, выпустила Почта России

Сергунина рассказала о новом голосовании в проекте «Активный гражданин»


Музыкальные новости

"Новая волна" вернулась в Сочи с новой ведущей Аленой Белой

Баста сел в лужу с райдером: «Не знал, что ножка индейки чуть меньше человеческой. Захожу в гримерку — и вижу кладбище вареных ног»

«Metallica в Химках и табу для Shaman»: Паук пообещал избирателям «диктатуру» и фестиваль

Забравшая деньги Ларисы Долиной женщина-курьер останется под стражей



Социальный фонд оказывает помощь эвакуированным жителям Курской области

Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ

Более 6 миллионов жителей Московского региона выбрали электронные трудовые книжки

С начала 2024 года более 2,5 тысячи многодетных мам в Московском регионе досрочно вышли на пенсию


Объявлены судьи на матчи 3-го тура группового этапа Пути РПЛ Кубка России

"Спартак" уступил махачкалинскому "Динамо" в матче Кубка России

Музыкальный Продюсер. Известный музыкальный Продюсер.

В Wildberries озвучили причину приостановки иска Бакальчук о разводе


Станислав Кондрашов из ТЕЛЬФ АГ: автопроизводители Европы возглавят переход к “зеленой стали”?

Степан Орлов: Благодаря «Московскому долголетию» представители старшего поколения стали больше путешествовать

В Москву по М-12: сколько стоит и как долго ехать?

В Королеве сотрудники Росгвардии оказали первую помощь пострадавшему в ДТП мотоциклисту


Владислав Шапша работает в Москве над новым нацпроектом «Кадры»

Заместитель управляющего ОСФР по г. Москве и Московской области Алексей Путин об индексации работающим пенсионерам

Филиал Национального центра «Россия» появится в Иркутске


Свыше 4,8 тыс. случаев заболевания COVID-19 выявили в Москве за неделю

Заболеваемость коронавирусом в Москве выросла за неделю




200 лет - не возраст. Старую больницу превращают в современный медцентр

Около 100 кулинарных клубов открыли участники «Московского долголетия»

В театральной студии психиатрической больницы «Зазеркалье» продолжаются репетиции

Психотерапевт Файнзильберг объяснил, почему полезно разговаривать с собой


Польша впервые раскрыла список и объём помощи режиму Зеленского


"Спартак" уступил махачкалинскому "Динамо" в матче Кубка России

Юные оренбуржцы стали победителями чемпионата России по авиамодельному спорту

"Спартак Москва" проиграл махачкалинскому "Динамо" в матче Кубка России

Росгвардейцы обеспечили безопасность футбольном матча Кубка России в Москве


Лукашенко рассказал, как Беларусь пытаются оторвать от России

Президент Белоруссии Лукашенко прокомментировал арест Павла Дурова

Педагоги со всей Беларуси прибыли в Минск. Перед ними выступит Лукашенко

Лукашенко заявил о желании возобновить сотрудничество с Молдовой



Сергей Собянин. Главное за день

Собянин рассказал о росте электромобилестроения в Москве

Собянин: Образование Москвы готово к началу нового учебного года

Собянин: Москва продолжит внедрять новые инструменты для поддержки бизнеса


СКБ Контур и МОNT объявили о начале сотрудничества

Собянин рассказал о росте электромобилестроения в Москве

Московские спасатели на страже безопасности

Производитель электромобиля «Атом» сделал заказ новосибирским компаниям и вузу


Роман Мадянов госпитализирован, спектакли отменили

В Подмосковье повысят штрафы за неоплату проезда по платным дорогам

9 молодых елочек высадили у стелы работникам завода Дезхимоборудования в Пензе

В Подмосковье рассказали, в какое время выгоднее вызвать такси в День знаний


На трассе Москва-Архангельск мусоровоз опрокинулся в кювет

Цены на новостройки в Архангельске остановились: анализ рынка жилья

В росте цен на новостройки в Архангельске наступил период стагнации

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса


Акция-настроение «С книжных страниц – на большой экран»

Часть Ялты без воды, часть Симферополя - без света, часть Керчи - без газа

В Крыму трое мужчин избили подростков из-за мяча, попавшего в автомобиль

«Уходящая натура». Доходность в Севастополе от студий выше, чем в Симферополе


Кажетта Ахметжанова: 5 сновидений, которые предсказывают скорое богатство

Владислав Шапша работает в Москве над новым нацпроектом «Кадры»

В Подмосковье повысят штрафы за неоплату проезда по платным дорогам

Четыре марки, посвящённые архитектуре Кавминвод, выпустила Почта России












Спорт в России и мире

Новости спорта


Новости тенниса
Андрей Рублёв

Россиянин Рублев уверенно победил бразильца Уайлда на старте US Open






Маски с котиками: Влад А4 поделился забавным видео с дочерью

Роман Мадянов госпитализирован, спектакли отменили

Сергунина рассказала о новом голосовании в проекте «Активный гражданин»

В Подмосковье рассказали, в какое время выгоднее вызвать такси в День знаний