Добавить новость
ru24.net
News in English
Июль
2024

Driverless cars still lack common sense. AI chatbot technology could be the answer

0

A quick search on the internet will yield numerous videos showcasing the mishaps of driverless cars, often bringing a smile or laugh. But why do we find these behaviours amusing? It might be because they starkly contrast with how a human driver would handle similar situations.

Everyday situations that seem trivial to us can still pose significant challenges to driverless cars. This is because they are designed using engineering methods that differ fundamentally from how the human mind works. However, recent advancements in AI have opened up new possibilities.

New AI systems with language capabilities – such as the technology behind chatbots like ChatGPT – could be key to making driverless cars reason and behave more like human drivers.

Research on autonomous driving gained significant momentum in the late 2010s with the advent of deep neural networks (DNNs), a form of artificial intelligence (AI) that involves processing data in a way that is inspired by the human brain. This enables the processing of traffic scenario images and videos to identify “critical elements”, such as obstacles.

Detecting these often involves computing a 3D box to determine the sizes, orientations, and positions of the obstacles. This process, applied to vehicles, pedestrians and cyclists, for example, creates a representation of the world based on classes and spatial properties, including distance and speed relative to the driverless car.

This is the foundation of the most widely adopted engineering approach to autonomous driving, known as “sense-think-act”. In this approach, sensor data is first processed by the DNN. The sensor data is then used to predict obstacle trajectories. Finally the systems plan the car’s next actions.

While this approach offers benefits like easy debugging, the sense-think-act framework has a critical limitation: it is fundamentally different from the brain mechanisms behind human driving.

Lessons from the brain

Much about brain function remains unknown, making it challenging to apply intuition derived from the human brain to driverless vehicles. Nonetheless, various research efforts aim to take inspiration from neuroscience, cognitive science, and psychology to improve autonomous driving.

A long-established theory suggests that “sense” and “act” are not sequential but closely interrelated processes. Humans perceive their environment in terms of their capacity to act upon it.

For instance, when preparing to turn left at an intersection, a driver focuses on specific parts of the environment and obstacles relevant to the turn. In contrast, the sense-think-act approach processes the entire scenario independently of current action intentions.

San Francisco has been used as a testbed for robotaxi services. Tada Images / Shutterstock

Another critical difference with humans is that DNNs primarily rely on the data they have been trained on. When exposed to a slight unusual variation of a scenario, they might fail or miss important information.

Such rare, underrepresented scenarios, known as “long-tail cases”, present a major challenge. Current workarounds involve creating larger and larger training datasets, but the complexity and variability of real-life situations make it impossible to cover all possibilities.

As a result, data-driven approaches like sense-think-act struggle to generalise to unseen situations. Humans, on the other hand, excel at handling novel situations.

Thanks to a general knowledge of the world, we are able to assess new scenarios using “common sense”: a mix of practical knowledge, reasoning, and an intuitive understanding of how people generally behave, built from a lifetime of experiences.

In fact, driving for humans is another form of social interaction, and common sense is key to interpreting the behaviours of road users (other drivers, pedestrians, cyclists). This ability enables us to make sound judgments and decisions in unexpected situations.

Copying common sense

Replicating common sense in DNNs has been a significant challenge over the past decade, prompting scholars to call for a radical change in approach. Recent AI advancements are finally offering a solution.

Large language models (LLMs) are the technology behind chatbots such as ChatGPT and have demonstrated remarkable proficiency in understanding and generating human language. Their impressive abilities stem from being trained on vast amounts of information across various domains, which has allowed them to develop a form of common sense akin to ours.

More recently, multimodal LLMs (which can respond to user requests in text, vision and video) like GPT-4o and GPT-4o-mini have combined language with vision, integrating extensive world knowledge with the ability to reason about visual inputs.

These models can comprehend complex unseen scenarios, provide natural language explanations, and recommend appropriate actions, offering a promising solution to the long-tail problem.

In robotics, vision-language-action models (VLAMs) are emerging, combining linguistic and visual processing with actions from the robot. VLAMs are demonstrating impressive early results in controlling robotic arms through language instructions.

In autonomous driving, initial research is focusing on using multimodal models to provide driving commentary and explanations of motor planning decisions. For example, a model might indicate, “There is a cyclist in front of me, starting to decelerate,” providing insights into the decision-making process and enhancing transparency. The company Wayve has shown promising initial results in applying language-driven driverless cars at a commercial level.

Future of driving

While LLMs can address long-tail cases, they present new challenges. Evaluating their reliability and safety is more complex than for modular approaches like sense-think-act. Each component of an autonomous vehicle, including integrated LLMs, must be verified, requiring new testing methodologies tailored to these systems.

Additionally, multimodal LLMs are large and demanding on a computer’s resources, leading to high latency (a delay in action or communication from the computer). Driverless cars need real-time operation, and current models cannot generate responses quickly enough. Running LLMs also requires significant processing power and memory, which conflicts with the limited hardware constraints of vehicles.

Multiple research efforts are now focused on optimising LLMs for use in vehicles. It will take a few years before we see commercial driverless vehicles with common-sense reasoning on the streets.

However, the future of autonomous driving is bright. In AI models featuring language capabilities, we have a solid alternative to the sense-think-act paradigm, which is nearing its limits.

LLMs are widely considered the key to achieving vehicles that can reason and behave more like humans. This advancement is crucial, considering that approximately 1.19 million people die each year due to road traffic crashes.

Road traffic injuries are the leading cause of death for children and young adults aged 5-29 years. The development of autonomous vehicles with human-like reasoning could potentially reduce these numbers significantly, saving countless lives.

Alice Plebe does not work for, consult, own shares in or receive funding from any company or organisation that would benefit from this article, and has disclosed no relevant affiliations beyond their academic appointment.




Moscow.media
Частные объявления сегодня





Rss.plus



Выиграй поездку на Like Party «ДЕВИЧНИК»

За прошедшую неделю подмосковные росгвардейцы выезжали более 2100 раз по сигналам «Тревога» с охраняемых объектов

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Раскрутка Сайта. Раскрутка сайта Москва. SEO раскрутка сайта. Заказать раскрутку сайта. Раскрутка сайта ru.


XI Всероссийский конкурс «Лучшая инклюзивная школа России-2024»

Главные инженеры сервисных локомотивных депо Северного полигона обменялись опытом организации технологических процессов и бережливого производства.

Покупатель отказался от сделки по даче Пугачевой

Определены организации-финалисты XI Всероссийского конкурса «Лучшая инклюзивная школа России — 2024»


America’s Greatest Tradition

My husband and I just took our first kid-free vacation. It helped me realize how much he's changed since becoming a father.

Cyprus Business Now: high rents, financial support to wine industry, PwC’s Academy Business Professionals Certificate

Single family residence sells for $2.4 million in San Jose


Мари Краймбрери, Клава Кока, bearwolf и не только! Like FM устраивает звездный девичник

XI Всероссийский конкурс «Лучшая инклюзивная школа России-2024»

На строительство и реконструкцию трассы М-7 Волга в Татарстане и Башкирии выделили 9 млрд рублей

Участок трассы Краснодар – Ейск на Кубани отремонтировали по БКД


Metaphor: ReFantazio's ReViews are in, and the Persona follow-up looks like 2024's unanimous RPG hit

The Big Catch: Tacklebox is the hardest 3D platformer I've ever played, 8+ hours long, and a free to play 'prologue' to a bigger, better game on the way

A Quake 2 Remaster dev has rebuilt the game's unique PlayStation port from scratch and released it as a free add-on

Epic Boss Tim Sweeney says Unreal Engine 6 will be a 'metaverse' joining Fortnite and other Unreal games, including an upcoming 'persistent universe' in development with Disney



KAMBULAT презентует новый альбом в VK Gipsy. Like FM дарит билеты

"Фортуна" на льду: как многодетная мама развивает уникальную хоккейную команду для слабовидящих детей

XI Всероссийский конкурс «Лучшая инклюзивная школа России-2024»

Бесплатный прогноз на год




За прошедшую неделю подмосковные росгвардейцы выезжали более 2100 раз по сигналам «Тревога» с охраняемых объектов

После отказа Пакистана сборная России по футболу сыграет с Сирией

Релиз трека. Релиз новой песни. Релиз сингла. Релиз Музыкального альбома.

МегаФон улучшил качество связи на федеральной трассе «Р-23» в Псковской области


СМИ: 12-летняя девочка скончалась от менингита в подмосковном Наро-Фоминске

Уже 56% уличных светильников в Петербурге заменили на современные светодиодные

Региональный этап фестиваля по борьбе среди школьников пройдет в Подмосковье 20 октября

V Всероссийский форум выпускников детских домов «Мы нужны друг другу»


Синнер сделал предложение Калинской на вечеринке в Нью-Йорке. Россиянка согласилась

Рахимова победила Учижиму и вышла во второй круг турнира WTA в Ухане

Янник Синнер опроверг слухи о своей помолвке

«Стали хуже после коронавируса»: Медведев неприличным образом привлёк внимание к проблеме с мячами


Уже 56% уличных светильников в Петербурге заменили на современные светодиодные

Региональный этап фестиваля по борьбе среди школьников пройдет в Подмосковье 20 октября

Глава города Владимира Дмитрий Наумов пошел учиться в "Школу мэров"

Российский рынок продолжит падение


Музыкальные новости

Пианист Денис Мацуев перенес концерты в Новосибирске, Кемерове и Барнауле

Содружественные страны // Главы МИДов государств СНГ выступили на разогреве перед лидерами

«Времена года» Антонио Вивальди прозвучат в Эрмитаже

«Человек поет такие песни! Вы бы никогда не подумали, что он такой козёл!» Певица Бьянка рассказала о домогательствах известного певца в студии «Шоу Воли» на ТНТ



Выиграй поездку на Like Party «ДЕВИЧНИК»

KAMBULAT презентует новый альбом в VK Gipsy. Like FM дарит билеты

XI Всероссийский конкурс «Лучшая инклюзивная школа России-2024»

"Фортуна" на льду: как многодетная мама развивает уникальную хоккейную команду для слабовидящих детей


Собянин и Патрушев открыли новый выставочный комплекс «Тимирязев центр»

Павел Дуров заявил, что его девушка Юлия Вавилова, прилетевшая с ним в Париж, была беременна и потеряла ребенка из-за стресса

Группа «Сезон дождей» приняла участие в проекте «Сила родной земли. Песни о вечном»

Песков заявил о сохранении доверительных отношений между странами СНГ


Московское такси: От прошлого к настоящему

«Деловые Линии» рассказали, как оптимизировали доставку от и до адреса в дни пикового спроса

Узнайте, как продать авто дороже с помощью historyautocleaning.ru

На стройплощадке будущей развязки на Московском тракте в Тюмени началось строительство павильона пешеходного перехода


Путин: страны СНГ совместно отметят 80-летие победы в ВОВ в 2025 году

Посольство РФ в США выразило возмущение из-за оскорблений Харрис в адрес Путина

Владимир Путин будет чествовать Александра Лукашенко в Кремле

Путин: ключевое направление совместной работы стран СНГ – борьба с терроризмом


Более 2 тысяч человек госпитализировали в России с COVID-19 за прошедшую неделю

Свыше 5 тыс. случаев заболевания COVID-19 выявили в столице за неделю

Как создать погоду в доме: решение от российского производителя ТИОН




Массаж и лечебная физкультура: показания и противопоказания

День борьбы с артритом 2024 в «НМИЦ здоровья детей»

Врач дерматолог-косметолог Мадина Байрамукова: как защитить кожу от санитайзеров

Массаж и лечебная физкультура: показания и противопоказания


В Киеве выступили со срочным обращением к Зеленскому

В Киеве заявили, Зеленский должен сам решиться на переговоры с РФ

Мирные переговоры с РФ: Зеленский готов смягчить свою позицию — Bloomberg


"Фортуна" на льду: как многодетная мама развивает уникальную хоккейную команду для слабовидящих детей

Смородская о сборной России: «Тренировки или матч против какой-то там неофициальной сборной Пакистана – все это не вдохновляет. Лучше с нашими клубами сыграть»

КХЛ. ЦСКА — «Салават Юлаев». Прямая трансляция: смотреть онлайн

Массаж и лечебная физкультура: показания и противопоказания


Путин: РФ и Белоруссия могут дополнять друг друга в промышленных проектах

Лукашенко назвал коррекцию ядерной доктрины России усилением позиции Минска

Лукашенко назвал коррекцию ядерной доктрины России усилением позиции Москвы и Минска

Лукашенко заявил, что коррекция ядерной доктрины РФ усилит Москву и Минск



Собянин: Завершено благоустройство Кадашевской набережной в Замоскворечье

Неделя мэра: инновационная площадка в «Рудневе», расселение по программе реновации и обновление школ

Мэр Москвы рассказал, как соцкоординаторы помогают пациентам больниц

Сергей Собянин: в Москве открылся сервис для взаимодействия науки и бизнеса


Главный KPI цифровой трансформации бизнес-процессов — в людях

Управляющий партнер "Самолет Москва" рассказал о тенденциях в строительстве

От Тулы до Рязани: волонтер ОМК собрал более 50 мешков мусора с берегов Оки

К ноябрю в Катунском заповеднике начнет работу музей меда


Массаж и лечебная физкультура: показания и противопоказания

СМИ: 12-летняя девочка скончалась от менингита в подмосковном Наро-Фоминске

Мытищинская самбистка стала лучшей спортсменкой года

Подмосковных предпринимателей пригласили на вебинар об экспорте в Саудовскую Аравию


Сотрудники ООО «Газпром трансгаз Ухта» очистили берега рек России

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G

Настольный сканер штрих-кодов Heroje H719N

В Поморье более 4000 человек посетили мероприятия акции «День краеведческих знаний»


Безногий дрессировщик хищников

Председателю СК России будет доложено о ходе расследования уголовного дела по факту насильственных действий в отношении жителя Республики Крым

Литературно-фольклорная программа «Хлебу – почтение вечное!»

Главное за день: 5 октября


Подмосковных предпринимателей пригласили на вебинар об экспорте в Саудовскую Аравию

Кардиолог Кондрахин: в тумане можно промокнуть и заболеть

Глава города Владимира Дмитрий Наумов пошел учиться в "Школу мэров"

Региональный этап фестиваля по борьбе среди школьников пройдет в Подмосковье 20 октября












Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Рыбакина узнала место в рейтинге WTA после разгрома в финале топового турнира






Глава города Владимира Дмитрий Наумов пошел учиться в "Школу мэров"

Массаж и лечебная физкультура: показания и противопоказания

Российский рынок продолжит падение

Региональный этап фестиваля по борьбе среди школьников пройдет в Подмосковье 20 октября