Добавить новость
ru24.net
News in English
Июль
2024

AI Evaluation Initiative Could Boost Commercial Adoption

0

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say. 

The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field.

The initiative seeks to create more robust benchmarks for complex AI applications, potentially unlocking billions in commercial value. As businesses look to deploy AI solutions, the lack of comprehensive evaluation tools has been a barrier to widespread adoption.

“We’re seeking evaluations that help us measure the AI Safety Levels (ASLs) defined in our Responsible Scaling Policy,” Anthropic stated in its announcement. These levels determine safety and security requirements for models with specific capabilities.

Checking for Threats

Key focus areas include assessments of AI models’ potential cybersecurity capabilities, such as vulnerability discovery and exploit development. The company also seeks “evaluations that assess two critical capabilities: a) the potential for models to significantly enhance the abilities of non-experts or experts in creating CBRN [chemical, biological, radiological and nuclear] threats, and b) the capacity to design novel, more harmful CBRN threats.”

The impact of this funding program is expected to be particularly significant for complex AI applications. “Straightforward applications like speech recognition already have decent benchmarks, but quantifying a model’s capability in assisting a crime is much more difficult,” Julija Bainiaksina, founder of the AI company MiniMe, told PYMNTS.

Improved benchmarks could address critical challenges in AI adoption for businesses. “The main problems of adapting generative AI at the moment are cost, hallucinations and safety,” Ilia Badeev, head of data science at Trevolution Group, told PYMNTS. “While the first is relatively predictable and controllable, the latter two are a pain and a breaking point for many projects and integrations.”

The initiative comes as significant tech companies race to develop increasingly powerful AI models, raising concerns about potential misuse. Anthropic, founded by former OpenAI researchers, has positioned itself as a “responsible” AI development leader.

“A robust, third-party evaluation ecosystem is essential for assessing AI capabilities and risks,” Anthropic emphasized. The company added that “developing high-quality, safety-relevant evaluations remains challenging, and the demand is outpacing the supply.”

What Makes a Good Evaluation?

Anthropic outlined several principles for good evaluations, including that they should be “sufficiently difficult” and “not in the training data.” The company stressed the importance of domain expertise: “If the evaluation is about expert performance on a particular subject matter (e.g., science), make sure to use subject matter experts to develop or review the evaluation.”

The company is accepting proposals through an online application form on a rolling basis. Its internal experts will work closely with selected teams to refine evaluation methods, noting that “refining an evaluation typically requires several iterations.”

Anthropic’s initiative could have far-reaching implications for the commercial AI landscape. By creating more reliable and comprehensive evaluation methods, businesses may gain the confidence to deploy AI solutions in critical areas such as healthcare, finance and customer service. This could potentially unlock productivity gains and new revenue streams across industries.

However, the success of this program will largely depend on the quality and relevance of the evaluations developed. If the new benchmarks fail to capture real-world scenarios adequately or are too narrowly focused, they may provide a false sense of security.

The challenge lies in creating rigorous evaluations to ensure safety and flexibility to keep pace with rapidly evolving AI capabilities. As the initiative unfolds, monitoring how well the resulting evaluations translate to practical commercial applications will be crucial.

For all PYMNTS AI coverage, subscribe to the daily AI Newsletter.

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.




Moscow.media
Частные объявления сегодня





Rss.plus



Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. И почему АРУТЮНОВ только сейчас раскрыл, что на самом деле он является исполнителем хита “На Заре 2020”?

Раскрыта тайна трека “На Заре 2020”. Вокалистом проекта “НаЗаре” является финалист шоу “Голос” Сергей АРУТЮНОВ. Несостоявшийся дуэт АРУТЮНОВА и его наставника Басты.

Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. И почему АРУТЮНОВ только сейчас раскрыл, что на самом деле он является исполнителем хита “На Заре 2020”?

Отделение СФР по Москве и Московской области предостерегает: не поддавайтесь на уловки мошенников!


Экстремалы в деле: команда Marins Park Hotel Екатеринбург приняла участие в «Гонке Героев»

Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. И почему АРУТЮНОВ только сейчас раскрыл, что на самом деле он является исполнителем хита “На Заре 2020”?

Баста и Сергей АРУТЮНОВ - несостоявшийся дуэт. Имя вокалиста “Проекта НаЗаре” раскрыто.

Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. Раскрыто имя вокалиста, исполняющего хит “На Заре 2020”


25 Undefeated Boxers Who Were DESTROYED! Shocking Knockouts You Won't Believe

Types of Bearings and Their Applications: A Look into the Bearing Industry

Frustrated Hamilton had to "yank" steering wheel in Azerbaijan GP

Premier League clubs showing frustration over secretive Manchester City trial


ТСД промышленного класса Saotron RT-Т510

Серебрянка

«Ростелеком контакт-центр» снизил затраты на КДП на 5,5 млн рублей за счет внедрения HRlink

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный


Гайд по goodbyeDPI с графическим интерфейсом: установка и настройка для быстрой загрузки YouTube

Microsoft's recyclobot uses machine learning and computer vision to open and recycle 90% of hard drive components

Google results insist a Bugsnax sequel is coming out next month, but there's one small problem: Its devs aren't making one

EVE players are in revolt over CCP's blockchain plans: 'None of us want this crypto slop'



Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

Комфортная среда для жизни: создавать и поддерживать развитие

Онлайн автомобильный отчет vindetective как профессиональный инструмент

Руководитель Уссурийского ЛРЗ Желдорреммаш Александр Корчемлюк вошел в состав 8-го созыва депутатов Думы Уссурийского городского округа




Почти 20 наземных пешеходных переходов облагородят в Химках в 2024 году

Президент ТПП РФ поздравил сотрудников Роспотребнадзора с профессиональным праздником

На ужине в ресторане «Гельдт» устроят «Театральный бардак» по Чехову

Отделение СФР по Москве и Московской области предостерегает: не поддавайтесь на уловки мошенников!


Масштабный сбой произошел в работе сайта ФНС

«Городская электричка» перевезла более 1 млн пассажиров в Нижнем Новгороде за 8 месяцев

Имущество певицы Алсу и бизнесмена Абрамова арестовано судом

Отец раненной в Челябинске девочки рассказал, как дочь спасла одноклассницу


Озвучены позиции казахстанских теннисистов в мировом рейтинге ATP

Блинкова и Шериф стали победительницами парного разряда турнира WTA-250 в Монастире

«На Уимблдоне играл хуже». Бублик высказался о недооценке соперника в сенсационном матче Кубка Дэвиса

Шарапова выиграла голосование болельщиков на включение в Зал славы тенниса


На Дальнем Востоке погрузка угля в январе-августе 2024 г. выросла на 7%

"СберСпасибо": средний чек в ресторанах России вырос на 21%

Научный фестиваль WOW! HOW? отпразднует десятый день рождения

ТЕЛЬФ АГ: перезагрузка гейминга с акцентом на инновации и прогресс


Музыкальные новости

«Рахманинов. Моцарт» при поддержке Relax FM

Интермедиа: Анкудинова 24 октября - гостья у Маргулиса в его Квартирнике

Баста и Сергей АРУТЮНОВ - несостоявшийся дуэт. Имя вокалиста “Проекта НаЗаре” раскрыто.

Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. И почему АРУТЮНОВ только сейчас раскрыл, что на самом деле он является исполнителем хита “На Заре 2020”?



Соцфонд проиндексирует пенсии работающим пенсионерам в феврале

«Ростелеком контакт-центр» снизил затраты на КДП на 5,5 млн рублей за счет внедрения HRlink

Многодетные из Северного округа победили в интеллектуальной игре "Познавайка"

Онлайн автомобильный отчет vindetective как профессиональный инструмент


Раскрыта тайна трека “На Заре 2020”. Вокалистом проекта “НаЗаре” является финалист шоу “Голос” Сергей АРУТЮНОВ. Несостоявшийся дуэт АРУТЮНОВА и его наставника Басты.

Квартальнов назвал причины поражения минского «Динамо» от одноклубников из Москвы

Президент ТПП РФ поздравил сотрудников Роспотребнадзора с профессиональным праздником

Несостоявшийся дуэт финалиста шоу “Голос” Сергея АРУТЮНОВА и его наставника Басты. Раскрыто имя вокалиста, исполняющего хит “На Заре 2020”


Отделение СФР по Москве и Московской области вручило 29 автомобилей пострадавшим на производстве

Онлайн автомобильный отчет vindetective как профессиональный инструмент

Новая Рига лидирует по количеству заказов спортивного оборудования для домовладений

Суд заключил под стражу водителя, насмерть сбившего ребенка в Москве


Российская армия вырастет на 180 тысяч военнослужащих

Baijiahao: Путин ответил на провокации США, отправив самолеты к Аляске

У Путина на текущей неделе не запланированы контакты с главой МИД КНДР в Москве

Только у шести тысяч находящихся в приютах детей нет родителей




Дело по обвинению журналистов в освещении судов над Навальным поступило в суд


С чем обращаются к неврологу? Симптомы и проблемы

После посещения фитнес-клуба 6 костромичек потеряли деньги

С чем обращаются к неврологу? Симптомы и проблемы

Международный день безопасности пациентов


В Киеве объяснили, почему Зеленский не хочет переговоров

Economist: В США каждый раз находят новую причину для отказа Киеву в нанесении ударов вглубь РФ


После посещения фитнес-клуба 6 костромичек потеряли деньги

Сёстры Аверины: «Таких залов, как в Сайсары, есть только четыре по всей Москве»

Новорижское шоссе лидирует по количеству запросов на частные спортивные площадки

Новая Рига лидирует по количеству заказов спортивного оборудования для домовладений


Лукашенко помиловал 37 человек



Собянин переименовал Депстрой Москвы в департамент гражданского строительства

Мэр Москвы оценил внедрение энергоэффективных технологий в городе

Собянин: Энергоэффективные технологии помогают Москве экономить ресурсы

Собянин рассказал в соцсетях о преображении Нагорного района


Аномальная жара ожидает жителей столичного региона 16-18 сентября

Редкую птицу красноголового королька впервые заметили в Москве

Урожайная Луна. Затмение в Москве можно будет увидеть в ночь на 18 сентября

Юношу задержали после разбойного нападения на мужчину в лесопарке на северо-востоке Москвы


Владимир Ефимов: Определен победитель торгов на право комплексного развития участка в Коптеве

Масштабный сбой произошел в работе сайта ФНС

Научный фестиваль WOW! HOW? отпразднует десятый день рождения

«Городская электричка» перевезла более 1 млн пассажиров в Нижнем Новгороде за 8 месяцев


Кабинет Артиста.

В САФУ принимали фальшивых аспирантов

KEY CAPITAL: Самые маленькие квартиры в РФ строят в Ленинградской области, а самые большие — в Чечне

Студёно...


Час искусства «Знакомство с русскими художниками»

Литературно-исторический экскурс «Легендарный голос эпохи»

В Твери выгоднее, чем в Москве: названы города с самой быстрой окупаемостью покупки комнат

«Прибыль от арендного бизнеса». Симферополь и Севастополь в числе регионов, где самая низкая доходность комнат


Московские врачи провели раненой девочке из Суджи сложнейшую операцию

Источник 360.ru: в Москве произошел пожар в помещении БЦ с газовыми баллонами

Экспорт продукции машиностроения из Москвы в страны ШОС вырос на 3,3%

На Дальнем Востоке погрузка угля в январе-августе 2024 г. выросла на 7%












Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Рейтинг ATP. В топ-10 без изменений, Шаповалов покинул топ-100






"СберСпасибо": средний чек в ресторанах России вырос на 21%

Имущество певицы Алсу и бизнесмена Абрамова арестовано судом

Масштабный сбой произошел в работе сайта ФНС

На Дальнем Востоке погрузка угля в январе-августе 2024 г. выросла на 7%