Добавить новость
ru24.net
Блог сайта «Хайтек+»
Июнь
2024
1
2 3 4 5 6 7
8
9 10 11
12
13 14
15
16 17 18 19 20 21
22
23 24 25 26 27 28
29
30

OpenAI представила модель CriticGPT для исправления ошибок GPT-4

OpenAI создала CriticGPT в качестве помощника ИИ для тренеров-людей, которые проверяют программный код, сгенерированный ChatGPT. CriticGPT, основанная на семействе больших языковых моделей GPT-4, анализирует код и указывает на потенциальные ошибки. Таким образом, людям проще обнаружить недочеты, которые иначе могли бы остаться незамеченными.

Исследователи обнаружили, что в 63% случаев с естественными ошибками больших языковых моделей аннотаторы предпочли замечания CriticGPT замечаниям людей. Это предпочтение отчасти объясняется тем, что CriticGPT реже выдавал бесполезные «мелкие замечания» и генерировал меньше ложных срабатываний, то есть выдуманных проблем. Кроме того, команды, состоящие из людей и CriticGPT, писали более полные отчеты об ошибках по сравнению с работой только людей. При этом использование CriticGPT совместно с людьми позволило снизить уровень галлюцинаций по сравнению с работой только CriticGPT.

Разработка CriticGPT включала обучение модели на большом количестве данных, в которые вносились ошибки. Экспертов попросили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять примеры обратной связи, как будто они сами обнаружили эти недочеты. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок кодирования.

В ходе экспериментов CriticGPT продемонстрировала способность обнаруживать как преднамеренно внедренные ошибки, так и естественные ошибки в выходных данных ChatGPT.

Исследователи также разработали новую технику под названием Force Sampling Beam Search (FSBS). Этот метод помогает CriticGPT писать более подробные отчеты об ошибках в коде. Исследователи могут регулировать, насколько тщательно CriticGPT ищет проблемы, а также контролировать, как часто он может придумывать несуществующие ошибки. Этот баланс можно настраивать в зависимости от конкретных задач обучения ИИ.

Интересно, что возможности CriticGPT выходят за рамки простого анализа кода. В своих экспериментах ученые применили модель к подмножеству обучающих данных ChatGPT, которые ранее были оценены людьми-аннотаторами как безупречные. CriticGPT выявил ошибки в 24% случаев, которые впоследствии подтвердились экспертами.

В OpenAI полагают, что это демонстрирует потенциал модели переносить знания на задачи, не связанные с кодом, и подчеркивает ее способность обнаруживать тонкие ошибки, которые могут остаться незамеченными даже при тщательной человеческой оценке.

Несмотря на обнадеживающие результаты, у CriticGPT есть ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может оказаться недостаточным для оценки более длинных и сложных задач, которые предстоит решать будущим системам ИИ. Хотя CriticGPT и снижает количество ложных срабатываний, полностью устранить их не удается. Тренеры-люди все равно могут ошибаться в маркировке на основе этих ложных результатов. Наконец, CriticGPT наиболее эффективен при обнаружении ошибок, локализованных в определенной точке кода. Однако на деле ошибки в выходных данных ИИ часто распределены по нескольким частям ответа, что представляет собой проблему для будущих версий модели.

OpenAI планирует использовать модели, подобные CriticGPT, для помощи своим тренерам в оценке выходных данных больших языковых моделей. Это позволит улучшить инструменты оценки, но даже с помощью ИИ сложные задачи могут быть проблемой для людей.




Moscow.media
Частные объявления сегодня





Rss.plus



Подведены итоги конкурса «Мы верим твердо в героев спорта»

Стоит ли отдавать ребенка в частную школу?

Подведены итоги конкурса «Мы верим твердо в героев спорта»

Фестиваль «Песня года» 2024 состоится в ДС «Мегаспорт» в Москве


Токсиколог Кутушов рассказал, как не запутаться в витаминах D и D3

Певица Натали Орли вернулась к истокам

Желдорреммаш определил лучших работников локомотиворемонтных заводов 2024 года

Трещит голова и тотальная слабость: Доктор Кутушов объяснил, как метеозависимость влияет на наше состояние


My mother and I were still estranged when she died in 2019. I went to a medium to connect with her and it brought me closure.

Every time we go on holiday my husband ogles other women on the beach

Just hours left for thousands of hard-up households to get £100s worth of white goods or new boiler – how to claim now

Grisly suicide-pod tale blows up lies of ‘dignity’ in assisted suicide


Интервью с вампиром

Забетонирована первая опора моста «Парус»

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Чуйские зигзаги


Мафия-НН: Густой аромат армянского кофе наполнил воздух старательно украшенной гостиной.

Мультиплеерный данжен-кроулер Greedy Wizards: Speed Dungeon вышел в новой стране на iOS и Android

Elgato Game Capture Neo review

New California law inspired by Ubisoft and Sony requires retailers to warn consumers that the digital games they buy can be taken away at any time



Предложение новостроек в «старой» Москве за год выросло на 15%

Знаки зодиака: Москвички предпочитают украшения со львом

Стало известно, где живут самые щедрые женихи в России

Где найти запчасти на китайские авто?




С октября новый утильсбор на автомобили в России сделает их дороже - экспертное мнение

Работодатели стали охотнее трудоустраивать соискателей старше 50 лет

Подведены итоги конкурса «Мы верим твердо в героев спорта»

Стоит ли отдавать ребенка в частную школу?


Тематические экскурсии в «Москино» доступны для жителей и гостей столицы

Навели порядок в лесном массиве у стадиона

Именитые шеф-повара устроят дегустацию своих блюд в центре Улан-Удэ

Работодатели стали охотнее трудоустраивать соискателей старше 50 лет


Кудерметова вышла в третий круг турнира WTA 1000 в Пекине

Пегула выбила Кудерметову с турнира WTA в Пекине

Хачанов обыграл Черундоло и вышел в четвертьфинал турнира ATP в Пекине

Даниил Медведев обыграл Гаэля Монфиса и вышел во 2-й круг турнира ATP-500 в Пекине


Ефимов: в Печатниках инвестор откроет детсад по программе «1 рубль за квадратный метр в год»

Легендарная поп-группа 90-х «Шан-Хай» к своему 40-летию представила нового солиста

Победили быстрые. «Локомотив» и «Спартак» миром не разошлись

Тематические экскурсии в «Москино» доступны для жителей и гостей столицы


Музыкальные новости

Мартин Скорсезе решил отложить съемки фильмов об Иисусе Христе и Фрэнке Синатре

Хит-просвет от Билана

The Scorpions Forever tribute show отгремело в Хабаровске (ФОТО)

Певица Алсу снялась без фильтров и макияжа после омолаживающей процедуры



Где найти запчасти на китайские авто?

Знаки зодиака: Москвички предпочитают украшения со львом

72% москвичей нуждаются в площадках для выгула собак

Стало известно, где живут самые щедрые женихи в России


Петербург может стать столицей БРИКС

Бизнес-омбудсмен Подмосковья помог отменить запрет на реализацию продукции компании

Первую ракетку мира подводят под срок // Всемирное антидопинговое агентство будет добиваться дисквалификации Янника Синнера

Вашкевич: Cтараемся приблизить требования к тем, что ждут игроков в «Локомотиве»


В центре Москвы произошло массовое ДТП с участием полицейской машины

Достигнута договоренность об увеличении финансирования содержания трасс Колыма и Вилюй

Проверка подлинности автозапчастей: алгоритм

Певица Натали Орли вернулась к истокам


Лавров: решения Запада по ударам вглубь РФ покажут, как услышали Путина




Лавров заявил, что ФРГ молчат на запрос РФ показать, как лечили Навального


Трещит голова и тотальная слабость: Доктор Кутушов объяснил, как метеозависимость влияет на наше состояние

Токсиколог Кутушов рассказал, как не запутаться в витаминах D и D3

У вас “кортизоловое лицо”? Разобрался в вопросе токсиколог Кутушов

Мы не просто создаем продукты, мы решаем проблемы: Екатерина Паршина о "Симбионтах Кутушова"


Пресс-секретарь Зеленского: граждане РФ первыми узнают о разрешении Киеву бить вглубь России

The Spectator: Зеленский обвинит Запад в предательстве


«Динамо» (Махачкала) — «Динамо» (Москва): когда начало, где смотреть онлайн матч 10‑го тура РПЛ, 29 сентября

Современные тренажёры и трибуна для зрителей: Большой парк для собак открыли на юге Москвы

Олимпийские ценности: доступное жилье в Иваново сдадут по улучшенному стандарту

Локомотив – Оренбург: прогноз на матч 1 октября.




Собянин рассказал о реставрации объектов культурного наследия

Сергей Собянин. Главное за день

Собянин: Реставрация 14 жилых домов завершится в этом году

Собянин пригласил москвичей посетить павильон «Умный город» на ВДНХ


В царстве растений. Самая большая коллекция магнолий в России собрана в Гагаринском районе


Именитые шеф-повара устроят дегустацию своих блюд в центре Улан-Удэ

В Петербурге автобус сбил пешехода на КАД

Ефимов: в Печатниках инвестор откроет детсад по программе «1 рубль за квадратный метр в год»

Дети в США, квартира в Испании. Пронько поднял вопрос о главных "патриотах" России


ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

В Гидрометцентре прогнозируют температуру на 6-10°С выше нормы в нескольких регионах России

Прокуратура проверяет информацию о пропаже вертолета в Архангельской области

В Архангельске возобновилась реконструкция международного аэропорта в Талагах


Под Симферополем продолжается строительство нового крупного микрорайона

В Симферополе появится новый бизнес-центр “Крымский”

Прогноз погоды в Крыму на 26 сентября

В районе Симферополя появится необычный жилой квартал


Именитые шеф-повара устроят дегустацию своих блюд в центре Улан-Удэ

Стало известно, где живут самые щедрые женихи в России

«Уралдронзавод» разработал тяжёлый боевой дрон «Бердыш»

Россияне рассказали о плюсах отдыха в бархатный сезон












Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Кудерметова вышла в третий круг турнира WTA 1000 в Пекине






Тематические экскурсии в «Москино» доступны для жителей и гостей столицы

Победили быстрые. «Локомотив» и «Спартак» миром не разошлись

Ефимов: в Печатниках инвестор откроет детсад по программе «1 рубль за квадратный метр в год»

Навели порядок в лесном массиве у стадиона