Добавить новость
ru24.net
Все новости
Июнь
2024

В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны

Проводятся новые исследования проблем и возможностей масштабирования систем машинного обучения, лежащих в основе моделей искусственного интеллекта, но результаты довольно мрачные. Эксперты говорят, что у таких компаний, занимающихся искусственным интеллектом, как OpenAI, заканчиваются мировые (искусственные) данные для обучения текста. Модели, более продвинутые, чем нынешние, такие как GPT-5 или GPT-6, могут даже исчерпать доступные источники данных к 2026 году. Возникает вопрос: сможет ли ИИ продолжать развиваться без новых человеческих текстовых данных?

Последние достижения в области языкового моделирования в значительной степени зависят от больших объемов текста, написанного людьми, часто полученного из Интернета или архивов компаний. Фактически общедоступные текстовые базы данных содержат миллиарды слов с миллиардов веб-страниц. Тем не менее, недавние исследования показывают, что компании, занимающиеся искусственным интеллектом, сталкиваются с серьезной проблемой: истощением данных. Столкнувшись с потенциальными препятствиями на пути масштабирования больших языковых моделей (LLM), исследователь искусственного интеллекта Тамай Бесироглу сказал Associated Press: «Здесь есть серьезные узкие места".

«Если вы столкнетесь с ограничениями данных, вы не сможете эффективно расширить модель.

Обратите внимание: Учёные разработали революционную технологию для исследования египетских мумий.

А расширение модели, вероятно, является наиболее важным способом расширить возможности модели и улучшить качество результатов», — добавил он. Инструменты искусственного интеллекта также без разбора используют публичные онлайн-архивы, и это противоречивая тенденция в использовании данных, которая вызвала судебные иски. Так произошло, например, с издателем New York Times, который подал в суд на OpenAI за нарушение авторских прав.

К головокружительному снижению потока нового контента

Исследователи говорят, что если нынешние тенденции в развитии LLM сохранятся, модель сможет работать с набором данных размером примерно с все общедоступные текстовые данные в период с 2026 по 2032 год (или даже раньше, если модель будет переобучена) обучение. Кроме того, исследователи из аналитического центра Epoch AI в Сан-Франциско отметили в отчете, что объем текстовых данных, используемых только для обучения моделей ИИ, увеличивается примерно в 2,5 раза каждый год. Они также полагают, что крупные языковые модели, такие как GPT-4 от OpenAI и Llama 3 от Meta (которая считается экстремистской группировкой в ​​России и чья деятельность запрещена), могут выйти из строя в 2026 году.

Чтобы устранить это препятствие, другие исследователи изучают, как продолжить разработку языковых моделей после того, как наборы данных сгенерированного человеком текста будут исчерпаны. Они утверждают, что наиболее возможным решением является обучение языковых моделей на синтетических (сгенерированных) данных, что предполагает перенос обучения из областей, богатых данными. OpenAI, Google и Anthropic уже работают над этим решением.

Однако, согласно выводам ученых из Университета Райса и Стэнфордского университета, использование в этих моделях контента, созданного ИИ, приводит к значительному снижению качества генерируемого контента. Это может создать цикл самообмана и вызвать множество вопросов: смогут ли алгоритмы ИИ стать более эффективными, производя лучшие результаты с меньшим количеством данных.

«Я думаю, важно помнить, что нам не обязательно обучать все более и более крупные модели», — сказал Николас Паперно, исследователь искусственного интеллекта и доцент кафедры компьютерной инженерии в Университете Торонто. Тем не менее, результаты этого исследования подчеркивают важность продолжения исследований для измерения темпов роста эффективности данных, а также потенциальных улучшений, приносимых новыми методами.

Больше интересных статей здесь: Новости науки и техники.

Источник статьи: В настоящее время проводятся новые исследования, посвященные проблемам и возможностям масштабирования систем машинного обучения, питающих модели ИИ, и их результаты довольно плачевны.




Moscow.media
Частные объявления сегодня





Rss.plus



Радио Romantika рекомендует open-air «Легенды мирового рока»

Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Мытищинское предприятие ООО «Водомер» получило Диплом победителя в региональном конкурсе «100 лучших товаров России»

Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ


«Странные странности» из интервью российского историка – мой ответ армянину, «не помнящему» своего армянства…

Дистрибьюция Музыки.

Грибная охота: токсиколог Кутушов рассказал, как избежать отравления и собирать только безопасные грибы

Stephane Rolland осень-зима 2024


‘We’ll be woken up at 4am every DAY’ slam locals over £200m expansion of major UK airport… but some can’t wait

Crew of doomed Bayesian superyacht say they ‘saved who they could’

Snell shines, Chapman plays hero as SF Giants rally for needed win

Former Jamaica ace hopes new guide for mums in football leads to better support for female players with children


Прогулки над облаками...

StarLine на Международном Евразийском форуме «Такси»

После строительства трассы М-12 в «Омутище» Владимирской области подтапливало дома – на участке устроили водопропускную трубу

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный


The PC game releases we're most excited about in September

Asus ROG Zephyrus G16 (2024) GA605 review

10 tips to get started in Star Wars Outlaws

Мафия-НН: В уютном ресторанчике в центре города встретились девять одноклассников, чтобы отпраздновать Новый Год и провести веселый вечер


Як вибрати накладний замок

Як встановити ручки на планці для дверей


Грибная охота: токсиколог Кутушов рассказал, как избежать отравления и собирать только безопасные грибы

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Metaratings: «Динамо» интересуется Тикнизяном

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья




Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

"Локомотив" и "Краснодар" объявили составы на матч чемпионата России

Возвращение на сцену: «МыНы» выпустили новый альбом

Актер Чепурченко потерял передний зуб на съемках шоу «Выжить в Дубае»


Тринадцать самолетов перенаправили в нижегородский аэропорт из Москвы

Дома для переселенцев из аварийного жилья в Рошале достроят к зиме

"Это принесёт гордость её семье и наставникам": Фигуристка Валиева поступила в МГИМО и будет работать на федеральном канале

Более 30 детей приняли участие в рыболовном турнире в Подольске


Российская теннисистка Потапова вышла в третий круг US Open

Раскрыты все болезни Елены Рыбакиной. Она пропустила уже восемь турниров в 2024 году

Теннисистка Самсонова вышла в четвертый круг US Upen

Теннисист Рублев вышел в четвертый круг Открытого чемпионата США


Легенда "Спартака" Титов назвал Барко лидером команды в текущем сезоне

Россиянка спутала незнакомца с курьером и отдала ему платья за миллион рублей

"Это принесёт гордость её семье и наставникам": Фигуристка Валиева поступила в МГИМО и будет работать на федеральном канале

Актер Чепурченко потерял передний зуб на съемках шоу «Выжить в Дубае»


Музыкальные новости

Балерина Волочкова назвала бредом идею Госдумы о проверке звезд на алкоголь

US Open. Рублев сыграет первым запуском на Арене Артура Эша, Гауфф – вторым, Соболенко последним на Арене Луи Армстронга

Певица Полина Гагарина отдаст часть гонорара за выступление в Уфе в помощь жителям Курской области

Уехала жить в Лондон: Лепс рассказал об отношениях с невестой на расстоянии



Грибная охота: токсиколог Кутушов рассказал, как избежать отравления и собирать только безопасные грибы

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Прогулки по Москве

Metaratings: «Динамо» интересуется Тикнизяном


Бедрос Киркоров госпитализирован в реанимацию в Москве

Все течет, все штрафуется // С 1 сентября меняются суммы наказания для водителей

Собянин сообщил о ликвидации силами ПВО десяти БПЛА, летевших к Москве

Вылет рейсов из аэропорта Внуково задержался после работы сил ПВО в Подмосковье


«Спартак» — «Автомобилист» — 4:3 Б. Видеообзор матча Кубка мэра Москвы

Определился соперник ЦСКА по финалу Кубка мэра Москвы

Грузовик протаранил автобус с 27 людьми в Новой Москве, есть погибшие

Shot: россиянка отдала случайному прохожему платья почти на 850 тысяч рублей


Мэр Ландеты предложил Путину запустить образовательный курс

Песков рассказал о реакции Путина на то, что Байден назвал его «убийцей»

Путин: Россия будет наращивать взаимовыгодные связи с Киргизией

Путин назвал Узбекистан стратегическим союзником в День независимости республики





Терпеть нельзя: Доктор Кутушов рассказал, почему нужно помочиться сразу же

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Токсиколог Кутушов назвал привычку ставить много будильников опасной для здоровья

Токсиколог Кутушов назвал неожиданную пользу лисичек в борьбе с паразитами



"Спартак" в меньшинстве вырвал победу в матче против "Рубина"

Прогулки по Москве

Metaratings: «Динамо» интересуется Тикнизяном

«Оренбург» — «Динамо» Москва — 2:2. Видеообзор матча РПЛ со спасительным голом на 95-й минуте




Собянин: БПЛА сбили на подлете к Москве в городском округе Подольск

Собянин: Еще один сбитый беспилотник при падении повредил техническое помещение МНПЗ

Собянин сообщил о ликвидации силами ПВО десяти БПЛА, летевших к Москве

Собянин: силы ПВО сбили в Одинцове четвертый БПЛА, летевший в сторону Москвы


«Инопланетное происхождение»: что за золотой шар обнаружили на дне Тихого океана

«Вымершая‎» серая цапля прилетела в Москву

В Москве обнаружили краснокнижных серых цапель, которых считали исчезнувшими

Птицы массово гибнут на пруду в Новой Москве


«Оренбург» — «Динамо» Москва — 2:2. Видеообзор матча РПЛ со спасительным голом на 95-й минуте

Торопецкие библиотекари приняли участие в конференции по военной литературе

Легенда "Спартака" Титов назвал Барко лидером команды в текущем сезоне

Россиянка спутала незнакомца с курьером и отдала ему платья за миллион рублей


Близкая Арктика: что посмотреть в Архангельской области

В Арктике разворачивается «гонка вооружений». США пытаются препятствовать сотрудничеству РФ и КНР

Полярные сияния наблюдали в нескольких регионах России

Жители Архангельской области и других регионов России наслаждались редким северным сиянием


В ДТП под Симферополем погибли два человека

1 и 2 сентября филиал РТРС «РТПЦ Республики Мордовия» и Министерство образования Республики Мордовия проведут совместную акцию, приуроченную ко Дню знаний и началу нового учебного года.

Книжная выставка «Без меня народ не полный…» к 125-летию со дня рождения А.П.Платонова, русского и советского писателя, поэта и публициста, драматурга.

Крымэнерго: в Симферополе, Евпатории, Алуште, Ялте, Керчи и Джанкое частично отключат свет 2 сентября


Птицы массово гибнут на пруду в Новой Москве

"Это принесёт гордость её семье и наставникам": Фигуристка Валиева поступила в МГИМО и будет работать на федеральном канале

Торопецкие библиотекари приняли участие в конференции по военной литературе

Актер Чепурченко потерял передний зуб на съемках шоу «Выжить в Дубае»












Спорт в России и мире

Новости спорта


Новости тенниса
US Open

Рублев стал участником рекордного пятисетового матча на турнирах Большого шлема






Беллу любил, с Лидой жил. Как Василий Шукшин первый фильм снимал

«Турецкие авиалинии» объяснили, почему «пленили» российских туристов в аэропорту Анталии

"Теперь точно запрещено": пенсионеров, доживших до 70 лет, ждет неожиданный сюрприз с 1 сентября

Актер Чепурченко потерял передний зуб на съемках шоу «Выжить в Дубае»