Language AIs in 2024: Size, guardrails and steps toward AI agents

28.12.2024 08:38

Rappler.com

I research the intersection of artificial intelligence, natural language processing and human reasoning as the director of the Advancing Human and Machine Reasoning lab at the University of South Florida. I am also commercializing this research in an AI startup that provides a vulnerability scanner for language models.

From my vantage point, I observed significant developments in the field of AI language models in 2024, both in research and the industry.

Perhaps the most exciting of these are the capabilities of smaller language models, support for addressing AI hallucination, and frameworks for developing AI agents.

Small AIs make a splash

At the heart of commercially available generative AI products like ChatGPT are large language models, or LLMs, which are trained on vast amounts of text and produce convincing humanlike language. Their size is generally measured in parameters, which are the numerical values a model derives from its training data. The larger models like those from the major AI companies have hundreds of billions of parameters.

There is an iterative interaction between large language models and smaller language models, which seems to have accelerated in 2024.

First, organizations with the most computational resources experiment with and train increasingly larger and more powerful language models. Those yield new large language model capabilities, benchmarks, training sets and training or prompting tricks. In turn, those are used to make smaller language models — in the range of 3 billion parameters or less — which can be run on more affordable computer setups, require less energy and memory to train, and can be fine-tuned with less data.

No surprise, then, that developers have released a host of powerful smaller language models – although the definition of small keeps changing: Phi-3 and Phi-4 from Microsoft, Llama-3.2 1B and 3B, and Qwen2-VL-2B are just a few examples.

These smaller language models can be specialized for more specific tasks, such as rapidly summarizing a set of comments or fact-checking text against a specific reference. They can work with their larger cousins to produce increasingly powerful hybrid systems.

Wider access

Increased access to highly capable language models large and small can be a mixed blessing. As there were many consequential elections around the world in 2024, the temptation for the misuse of language models was high.

Language models can give malicious users the ability to generate social media posts and deceptively influence public opinion. There was a great deal of concern about this threat in 2024, given that it was an election year in many countries.

And indeed, a robocall faking President Joe Biden’s voice asked New Hampshire Democratic primary voters to stay home. OpenAI had to intervene to disrupt over 20 operations and deceptive networks that tried to use its models for deceptive campaigns. Fake videos and memes were created and shared with the help of AI tools.

Despite the anxiety surrounding AI disinformation, it is not yet clear what effect these efforts actually had on public opinion and the U.S. election. Nevertheless, US states passed a large amount of legislation in 2024 governing the use of AI in elections and campaigns.

Misbehaving bots

Google started including AI overviews in its search results, yielding some results that were hilariously and obviously wrong — unless you enjoy glue in your pizza. However, other results may have been dangerously wrong, such as when it suggested mixing bleach and vinegar to clean your clothes.

Large language models, as they are most commonly implemented, are prone to hallucinations. This means that they can state things that are false or misleading, often with confident language. Even though I and others continually beat the drum about this, 2024 still saw many organizations learning about the dangers of AI hallucination the hard way.

Despite significant testing, a chatbot playing the role of a Catholic priest advocated for baptism via Gatorade. A chatbot advising on New York City laws and regulations incorrectly said it was “legal for an employer to fire a worker who complains about sexual harassment, doesn’t disclose a pregnancy or refuses to cut their dreadlocks.” And OpenAI’s speech-capable model forgot whose turn it was to speak and responded to a human in her own voice.

Fortunately, 2024 also saw new ways to mitigate and live with AI hallucinations. Companies and researchers are developing tools for making sure AI systems follow given rules pre-deployment, as well as environments to evaluate them. So-called guardrail frameworks inspect large language model inputs and outputs in real time, albeit often by using another layer of large language models.

And the conversation on AI regulation accelerated, causing the big players in the large language model space to update their policies on responsibly scaling and harnessing AI.

But although researchers are continually finding ways to reduce hallucinations, in 2024, research convincingly showed that AI hallucinations are always going to exist in some form. It may be a fundamental feature of what happens when an entity has finite computational and information resources. After all, even human beings are known to confidently misremember and state falsehoods from time to time.

The rise of agents

Large language models, particularly those powered by variants of the transformer architecture, are still driving the most significant advances in AI. For example, developers are using large language models to not only create chatbots, but to serve as the basis of AI agents. The term “agentic AI” shot to prominence in 2024, with some pundits even calling it the third wave of AI.

To understand what an AI agent is, think of a chatbot expanded in two ways: First, give it access to tools that provide the ability to take actions. This might be the ability to query an external search engine, book a flight or use a calculator. Second, give it increased autonomy, or the ability to make more decisions on its own.

For example, a travel AI chatbot might be able to perform a search of flights based on what information you give it, but a tool-equipped travel agent might plan out an entire trip itinerary, including finding events, booking reservations and adding them to your calendar. AI agents can perform multiple steps of a task on their own.

In 2024, new frameworks for developing AI agents emerged. Just to name a few, LangGraph, CrewAI, PhiData and AutoGen/Magentic-One were released or improved in 2024.

Companies are just beginning to adopt AI agents. Frameworks for developing AI agents are new and rapidly evolving. Furthermore, security, privacy and hallucination risks are still a concern.

But global market analysts forecast this to change: 82% of organizations surveyed plan to use agents within 1-3 years, and 25% of all companies currently using generative AI are likely to adopt AI agents in 2025. – Rappler.com

This article originally appeared in The Conversation.

John Licato, Associate Professor of Computer Science, Director of AMHR Lab, University of South Florida

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Life24.pro

ГК «ДИАКОН» представляет современные решения лабораторной диагностики на XI Международном конгрессе «Санаторно-курортное лечение»

Клещи нападают не на всех: доктор Садыков объяснил, как микробиом кожи человека влияет на паразитов

Выиграть миллион на «Юмор FM» помогает улыбка

«Лицо деформировано, а платье - из сундука бабушки»: сбежавшая из России Вера Брежнева ошеломила поклонников появлением на красной дорожке

Today24.pro

EuroMillions jackpot rolls over to £185,000,000 after no one claims ticket

Trump’s tariffs are headed for a constitutional showdown at the Supreme Court that could reshape presidential power for decades

Arsenal ‘pushing hardest’ for Julian Alvarez transfer but face battle with Premier League rivals for ex-Man City star

European Darts Open 2025: Schedule and results as Nathan Aspinall and Stephen Bunting head stacked field

News24.pro

В Тверской области прошёл благотворительный концерт «Культура в помощь Донбассу»

Российские HR рассказали, чего им не хватает в комплексных HRTech-решениях

Управляйте климатом и безопасностью своего авто с помощью смартфона

Люси Пылаева и гигантский Labubu: новый уровень модной иронии на RU.TV 2025

Game24.pro

Игра Cultivation Chat Group заняла топ-7 в китайском App Store

The Kingmakers system requirements show that the hardest part of running the game may be finding 80 GB free for the install

This underwater city builder had me more emotionally invested in my corals than SimCity does in my human citizens, and you can try it at the next Steam Next Fest

Началась предзагрузка Crystal of Atlan на PC и смартфонах

Russia24.pro

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

ЦСКА в сезоне 2024/25

Культура на русском. Креативные индустрии 5.0

Покупки для детей в ТРЦ «Нора»

Другие проекты от SMI24.net

News-life

ОГРОМНЫЙ ПОЛИТИЧЕСКИЙ СКАНДАЛ: США И СССР ПОДГОТОВИЛИ СНОС...США. СЕНСАЦИЯ! Важные новости! В.В. Путин, Дональд Трамп, Илон Маск. Россия, США, Европа могут улучшить отношения и здоровье общества?!

Куда отправиться из Москвы в речном круизе? Обзор городов и теплоходов

Люси Пылаева и гигантский Labubu: новый уровень модной иронии на RU.TV 2025

На связи с соседями. В празднике ЕР приняли участие десятки тысяч человек

Ru24.net

Москвичи чаще называют линии метро по цветам

Интер РАО не планирует переводить электростанции с газа на уголь

Суоми виноваты! Как выгодное соседство с Россией превратилось для Финляндии в экономический коллапс

Купить Песню. Песни на продажу. Продажа песен. Продажа Авторских песен.

News.tennis

Елена Рыбакина вышла в третий круг Открытого чемпионата Франции — 2025

Мирра Андреева раскрыла необычный секрет разгромной победы над Юлией Путинцевой

Звездная русская отомстила американке за унижение в Нью-Йорке. Андреева — любимица Парижа

Рублёв без матча вышел в 4-й круг «РГ», новый вратарь из России в НХЛ. Главное к утру

29ru.net

ЦСКА готов заплатить восемь миллионов евро за Алвеса, пишут СМИ

Москвичи чаще называют линии метро по цветам

В столице подвели итоги конкурса учителей «Педагоги года Москвы»

"Автостат": импорт легковых автомобилей из Южной Кореи в РФ вырос на 84%

Музыкальные новости

Poisk-music.ru

Обнародованы доходы компаний продюсера Матвиенко

Севастополь снова встречает детский благотворительный фестиваль «Добрая волна»

Бой Призрака с драконами под Evanescence — два новых трейлера героини Elden Ring Nightreign

В Чите прозвучит голос единства: благотворительный концерт «Культура в помощь Донбассу»

Ria.city

Севастополь снова встречает детский благотворительный фестиваль «Добрая волна»

Специальный показ анимационного фильма «Ай да Пушкин!» на фестивале «Пушкинфест» в Тверской области

Культура на русском. Креативные индустрии 5.0

Покупки для детей в ТРЦ «Нора»

Rss.plus

Сергей Собянин: В Москве более 65 компаний в проекте «Техностажировка»

Архангельские гребцы завоевали две медали на первенстве России в Краснодаре

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

Суд ограничил доступ к видео на YouTube с ответами на ЕГЭ 2025 года

Auto.russia24.pro

Ефимов: в Западном Дегунине около 700 горожан осматривают жилье по реновации

Владимир Ефимов: В Западном Дегунине около 700 горожан приступили к осмотру жилья по программе реновации

"Авито" запустил онлайн-бронирование такси в Москве и Санкт-Петербурге

В Москве на Онежской улице из-за массового ДТП образовалась пробка

Putin.russia24.pro

Для участников специальной военной операции обеспечат возможность поступления на муниципальную службу

Визит вдовы Абэ к Путину подарил надежду в нормализацию отношений России и Японии

Путин предложил регионам рекомендации по обучению участников СВО

Путин поручил меры по сохранению памяти о защитниках Родины

Covid.russia24.pro

Новые условия безвиза планируют согласовать в июне Россия и Китай

Правительство США утвердило новую вакцину против COVID-19 для применения

Health.russia24.pro

Как подготовиться к визиту к трихологу?

По факту массового заболевания пассажиров теплохода в Угличе возбуждено уголовное дело

Московских врачей заманили на работу в Волгоградскую область

Косметолог Никитенко назвала бьюти-процедуры, которые можно делать во время беременности

Zelensky.russia24.pro

Зеленский совершил очередную хамскую провокацию

Sport.russia24.pro

Трилогия Скотта Янга «Мой кумир - хоккей» влюбила в спорт миллионы мальчишек

ЦСКА в сезоне 2024/25

Саймон Купер: человек, который заставил футбол заговорить по-новому

Самые интересные игры для поклонников Формулы-1

Person.russian.city

Собянин поблагодарил московских спасателей за труд и профессионализм

Сергей Собянин. Главное за день

Мэр Москвы наградил лучших учителей Москвы

Сергей Собянин назвал имена победителей профессионального конкурса для учителей

Ecology.russia24.pro

В США произошла авария — грузовая фура с ульями с пчелами перевернулась

NBC: В США активисты требуют отключить суперкомпьютер Маска

За сутки в России было ликвидировано 44 природных пожара

Какие ягоды из Красной книги есть в лесах Подмосковья и что грозит за их сбор

29ru.net

"Автостат": импорт легковых автомобилей из Южной Кореи в РФ вырос на 84%

Эксперт Красноженов назвал количество граммов золота и серебра в ноутбуке

ЦСКА предложил 8 млн евро за бразильского хавбека

Москвичи чаще называют линии метро по цветам

Severodvinsk.ws

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев провел личный прием работников ГУП НАО «Нарьян-Марская электростанция»

Арктика с женским лицом: Архангельск готовится к масштабному форуму лидеров и идей

Город будущего — в твоих руках: жители Архангельской области выбирают, какие места благоустроят к 2026 году

Жаркое, дождливое и опасное: какое лето ждет россиян

Sevpoisk.ru

Акция «Поздравь библиотеку с праздником».

«Поэма» в сердце города: новый уровень жизни в центре Симферополя

Из Петербурга будут ходить регулярные автобусы в Геленджик и Симферополь

Встреча друзей «Библиотека – волшебное место, где книгам не скучно, где всем интересно».

103news.com

ЦСКА готов заплатить восемь миллионов евро за Алвеса, пишут СМИ

"Автостат": импорт легковых автомобилей из Южной Кореи в РФ вырос на 84%

ЦСКА предложил 8 млн евро за бразильского хавбека

Эксперт Красноженов назвал количество граммов золота и серебра в ноутбуке

Агрегатор новостей 24СМИ

Small AIs make a splash

Wider access

Philippines faces rising AI-driven disinformation

Misbehaving bots

The rise of agents

ГК «ДИАКОН» представляет современные решения лабораторной диагностики на XI Международном конгрессе «Санаторно-курортное лечение»

Клещи нападают не на всех: доктор Садыков объяснил, как микробиом кожи человека влияет на паразитов

Выиграть миллион на «Юмор FM» помогает улыбка

«Лицо деформировано, а платье - из сундука бабушки»: сбежавшая из России Вера Брежнева ошеломила поклонников появлением на красной дорожке

EuroMillions jackpot rolls over to £185,000,000 after no one claims ticket

Trump’s tariffs are headed for a constitutional showdown at the Supreme Court that could reshape presidential power for decades

Arsenal ‘pushing hardest’ for Julian Alvarez transfer but face battle with Premier League rivals for ex-Man City star

European Darts Open 2025: Schedule and results as Nathan Aspinall and Stephen Bunting head stacked field

В Тверской области прошёл благотворительный концерт «Культура в помощь Донбассу»

Российские HR рассказали, чего им не хватает в комплексных HRTech-решениях

Управляйте климатом и безопасностью своего авто с помощью смартфона

Люси Пылаева и гигантский Labubu: новый уровень модной иронии на RU.TV 2025

Игра Cultivation Chat Group заняла топ-7 в китайском App Store

The Kingmakers system requirements show that the hardest part of running the game may be finding 80 GB free for the install

This underwater city builder had me more emotionally invested in my corals than SimCity does in my human citizens, and you can try it at the next Steam Next Fest

Началась предзагрузка Crystal of Atlan на PC и смартфонах

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

ЦСКА в сезоне 2024/25

Культура на русском. Креативные индустрии 5.0

Покупки для детей в ТРЦ «Нора»

Куда отправиться из Москвы в речном круизе? Обзор городов и теплоходов

Люси Пылаева и гигантский Labubu: новый уровень модной иронии на RU.TV 2025

На связи с соседями. В празднике ЕР приняли участие десятки тысяч человек

Москвичи чаще называют линии метро по цветам

Интер РАО не планирует переводить электростанции с газа на уголь

Суоми виноваты! Как выгодное соседство с Россией превратилось для Финляндии в экономический коллапс

Купить Песню. Песни на продажу. Продажа песен. Продажа Авторских песен.

Елена Рыбакина вышла в третий круг Открытого чемпионата Франции — 2025

Мирра Андреева раскрыла необычный секрет разгромной победы над Юлией Путинцевой

Звездная русская отомстила американке за унижение в Нью-Йорке. Андреева — любимица Парижа

Рублёв без матча вышел в 4-й круг «РГ», новый вратарь из России в НХЛ. Главное к утру

ЦСКА готов заплатить восемь миллионов евро за Алвеса, пишут СМИ

Москвичи чаще называют линии метро по цветам

В столице подвели итоги конкурса учителей «Педагоги года Москвы»

"Автостат": импорт легковых автомобилей из Южной Кореи в РФ вырос на 84%

Обнародованы доходы компаний продюсера Матвиенко

Севастополь снова встречает детский благотворительный фестиваль «Добрая волна»

Бой Призрака с драконами под Evanescence — два новых трейлера героини Elden Ring Nightreign

В Чите прозвучит голос единства: благотворительный концерт «Культура в помощь Донбассу»

Севастополь снова встречает детский благотворительный фестиваль «Добрая волна»

Специальный показ анимационного фильма «Ай да Пушкин!» на фестивале «Пушкинфест» в Тверской области

Культура на русском. Креативные индустрии 5.0

Покупки для детей в ТРЦ «Нора»

Сергей Собянин: В Москве более 65 компаний в проекте «Техностажировка»

Архангельские гребцы завоевали две медали на первенстве России в Краснодаре

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

Суд ограничил доступ к видео на YouTube с ответами на ЕГЭ 2025 года

Ефимов: в Западном Дегунине около 700 горожан осматривают жилье по реновации

Владимир Ефимов: В Западном Дегунине около 700 горожан приступили к осмотру жилья по программе реновации

"Авито" запустил онлайн-бронирование такси в Москве и Санкт-Петербурге

В Москве на Онежской улице из-за массового ДТП образовалась пробка

Для участников специальной военной операции обеспечат возможность поступления на муниципальную службу

Визит вдовы Абэ к Путину подарил надежду в нормализацию отношений России и Японии

Путин предложил регионам рекомендации по обучению участников СВО

Путин поручил меры по сохранению памяти о защитниках Родины

Новые условия безвиза планируют согласовать в июне Россия и Китай

Правительство США утвердило новую вакцину против COVID-19 для применения

Как подготовиться к визиту к трихологу?

По факту массового заболевания пассажиров теплохода в Угличе возбуждено уголовное дело

Московских врачей заманили на работу в Волгоградскую область

Косметолог Никитенко назвала бьюти-процедуры, которые можно делать во время беременности

Зеленский совершил очередную хамскую провокацию

Трилогия Скотта Янга «Мой кумир - хоккей» влюбила в спорт миллионы мальчишек

ЦСКА в сезоне 2024/25

Саймон Купер: человек, который заставил футбол заговорить по-новому

Самые интересные игры для поклонников Формулы-1

Собянин поблагодарил московских спасателей за труд и профессионализм

Сергей Собянин. Главное за день

Мэр Москвы наградил лучших учителей Москвы

Сергей Собянин назвал имена победителей профессионального конкурса для учителей

В США произошла авария — грузовая фура с ульями с пчелами перевернулась

NBC: В США активисты требуют отключить суперкомпьютер Маска

За сутки в России было ликвидировано 44 природных пожара

Какие ягоды из Красной книги есть в лесах Подмосковья и что грозит за их сбор

"Автостат": импорт легковых автомобилей из Южной Кореи в РФ вырос на 84%