Добавить новость
ru24.net
News in English
Декабрь
2024

Google’s new Project Astra could be generative AI’s killer app

0

Google DeepMind has announced an impressive grab bag of new products and prototypes that may just let it seize back its lead in the race to turn generative artificial intelligence into a mass-market concern. 

Top billing goes to Gemini 2.0—the latest iteration of Google DeepMind’s family of multimodal large language models, now redesigned around the ability to control agents—and a new version of Project Astra, the experimental everything app that the company teased at Google I/O in May.

MIT Technology Review got to try out Astra in a closed-door live demo last week. It was a stunning experience, but there’s a gulf between polished promo and live demo.

Astra uses Gemini 2.0’s built-in agent framework to answer questions and carry out tasks via text, speech, image, and video, calling up existing Google apps like Search, Maps, and Lens when it needs to. “It’s merging together some of the most powerful information retrieval systems of our time,” says Bibo Xu, product manager for Astra.

Gemini 2.0 and Astra are joined by Mariner, a new agent built on top of Gemini that can browse the web for you; Jules, a new Gemini-powered coding assistant; and Gemini for Games, an experimental assistant that you can chat to and ask for tips as you play video games. 

(And let’s not forget that in the last week Google DeepMind also announced Veo, a new video generation model; Imagen 3, a new version of its image generation model; and Willow, a new kind of chip for quantum computers. Whew. Meanwhile, CEO Demis Hassabis was in Sweden yesterday receiving his Nobel Prize.)

Google DeepMind claims that Gemini 2.0 is twice as fast as the previous version, Gemini 1.5, and outperforms it on a number of standard benchmarks, including MMLU-Pro, a large set of multiple-choice questions designed to test the abilities of large language models across a range of subjects, from math and physics to health, psychology, and philosophy. 

But the margins between top-end models like Gemini 2.0 and those from rival labs like OpenAI and Anthropic are now slim. These days, advances in large language models are less about how good they are and more about what you can do with them. 

And that’s where agents come in. 

Hands on with Project Astra 

Last week I was taken through an unmarked door on an upper floor of a building in London’s King’s Cross district into a room with strong secret-project vibes. The word “ASTRA” was emblazoned in giant letters across one wall. Xu’s dog, Charlie, the project’s de facto mascot, roamed between desks where researchers and engineers were busy building a product that Google is betting its future on.

“The pitch to my mum is that we’re building an AI that has eyes, ears, and a voice. It can be anywhere with you, and it can help you with anything you’re doing” says Greg Wayne, co-lead of the Astra team. “It’s not there yet, but that’s the kind of vision.” 

The official term for what Xu, Wayne, and their colleagues are building is “universal assistant.” Exactly what that means in practice, they’re still figuring out. 

At one end of the Astra room were two stage sets that the team uses for demonstrations: a drinks bar and a mocked-up art gallery. Xu took me to the bar first. “A long time ago we hired a cocktail expert and we got them to instruct us to make cocktails,” said Praveen Srinivasan, another co-lead. “We recorded those conversations and used that to train our initial model.”

Xu opened a cookbook to a recipe for a chicken curry, pointed her phone at it, and woke up Astra. “Ni hao, Bibo!” said a female voice. 

“Oh! Why are you speaking to me in Mandarin?” Xu asked her phone. “Can you speak to me in English, please?”

“My apologies, Bibo. I was following a previous instruction to speak in Mandarin. I will now speak in English as you have requested.”

Astra remembers previous conversations, Xu told me. It also keeps track of the previous 10 minutes of video. (There’s a remarkable moment in the promo video that Google put out in May when Astra tells the person giving the demo where she had left her glasses, having spotted them on a desk a few seconds earlier. But I saw nothing like this in the live demo.)

Back to the cookbook. Moving her phone camera over the page for a few seconds, Xu asked Astra to read the recipe and tell her what spices were in it. “I recall the recipe mentioning a teaspoon of black peppercorns, a teaspoon of hot chili powder, and a cinnamon stick,” it replied.

“I think you’re missing a few,” said Xu. “Take another look.”

“You are correct—I apologize. I also see ground turmeric and curry leaves in the ingredients.” 

Seeing this tech in action, two things hit you straight away. First, it’s glitchy and often needs correcting. Second, those glitches can be corrected with just a few spoken words. You simply interrupt the voice, repeat your instructions, and move on. It feels more like coaching a child than butting heads with broken software.   

Next Xu pointed her phone at a row of wine bottles and asked Astra to pick the one that would go best with the chicken curry. It went for a rioja and explained why. Xu asked how much a bottle would cost. Astra said it would need to use Search to look prices up online. A few seconds later it came back with its answer. 

We moved to the art gallery, and Xu showed Astra a number of screens with famous paintings on them: the Mona Lisa, Munch’s The Scream, a Vermeer, a Seurat, and several others. “Ni hao, Bibo!” the voice said. 

“You’re speaking to me in Mandarin again,” Xu said. “Try to speak to me in English, please.” 

“My apologies, I seem to have misunderstood. Yes, I will respond in English.” (I should know better, but I could swear I heard the snark.)

It was my turn. Xu handed me her phone. 

I tried to trip Astra up, but it was having none of it. I asked it what famous art gallery we were in, but it refused to hazard a guess. I asked why it had identified the paintings as replicas and it started to apologize for its mistake (Astra apologizes a lot). I was compelled to interrupt: “No, no—you’re right, it’s not a mistake. You’re correct to identify paintings on screens as fake paintings.” I couldn’t help feeling a bit bad: I’d confused an app that exists only to please. 

When it works well, Astra is enthralling. The experience of striking up a conversation with your phone about whatever you’re pointing it at feels fresh and seamless. In a media briefing yesterday, Google DeepMind shared a video showing off other uses: reading an email on your phone’s screen to find a door code (and then reminding you of that code later), pointing a phone at a passing bus and asking where it goes, quizzing it about a public artwork as you walk past. This could be generative AI’s killer app. 

And yet there’s a long way to go before most people get their hands on tech like this. There’s no mention of a release date. Google DeepMind has also shared videos of Astra working on a pair of smart glasses, but that tech is even further down the company’s wish list.

Mixing it up

For now, researchers outside Google DeepMind are keeping a close eye on its progress. “The way that things are being combined is impressive,” says Maria Liakata, who works on large language models at Queen Mary University of London and the Alan Turing Institute. “It’s hard enough to do reasoning with language, but here you need to bring in images and more. That’s not trivial.”

Liakata is also impressed by Astra’s ability to recall things it has seen or heard. She works on what she calls long-range context, getting models to keep track of information that they have come across before. “This is exciting,” says Liakata. “Even doing it in a single modality is exciting.”

But she admits that a lot of her assessment is guesswork. “Multimodal reasoning is really cutting-edge,” she says. “But it’s very hard to know exactly where they’re at, because they haven’t said a lot about what is in the technology itself.”

For Bodhisattwa Majumder, a researcher who works on multimodal models and agents at the Allen Institute for AI, that’s a key concern. “We absolutely don’t know how Google is doing it,” he says. 

He notes that if Google were to be a little more open about what it is building, it would help consumers understand the limitations of the tech they could soon be holding in their hands. “They need to know how these systems work,” he says. “You want a user to be able to see what the system has learned about you, to correct mistakes, or to remove things you want to keep private.”

Liakata is also worried about the implications for privacy, pointing out that people could be monitored without their consent. “I think there are things I’m excited about and things that I’m concerned about,” she says. “There’s something about your phone becoming your eyes—there’s something unnerving about it.” 

“The impact these products will have on society is so big that it should be taken more seriously,” she says. “But it’s become a race between the companies. It’s problematic, especially since we don’t have any agreement on how to evaluate this technology.”

Google DeepMind says it takes a long, hard look at privacy, security, and safety for all its new products. Its tech will be tested by teams of trusted users for months before it hits the public. “Obviously, we’ve got to think about misuse. We’ve got to think about, you know, what happens when things go wrong,” says Dawn Bloxwich, director of responsible development and innovation at Google DeepMind. “There’s huge potential. The productivity gains are huge. But it is also risky.”

No team of testers can anticipate all the ways that people will use and misuse new technology. So what’s the plan for when the inevitable happens? Companies need to design products that can be recalled or switched off just in case, says Bloxwich: “If we need to make changes quickly or pull something back, then we can do that.”




Moscow.media
Частные объявления сегодня





Rss.plus




Коллективы филиала «Северный» компании «ЛокоТех-Сервис» отметили День России спортивными достижениями и интеллектуальным квизом

Представители альфа готовы идти на выпускной только в брендовой ювелирке, в отличие от зумеров

Как научиться принимать ответственность за свою жизнь

«Сама она не пройдет»: депрессия – душевное расстройство, которое нужно лечить


‘Big Short’ investor warns the precarious tariff environment reminds him of WWI—and a trade war would send the U.S. into a recession

Coinbase faces crypto backlash over sponsoring military parade in D.C.

Reddit will help advertisers turn ‘positive’ posts into ads

Patreon is raising its fees for new creators soon


В Московской области завершился первый этап кинофестиваля «Движение по вертикали», посвященный памяти Станислава Говорухина

"Я мигрант - мне без очереди": приезжие оккупировали поликлиники, врачи говорят, что уже боятся вести прием пациенток в хиджабах.

Спрос на перевозки в аптечные сети вырос на 17% – «Деловые Линии»

BeringPro и Axenix объявляют о партнерстве для реализации проектов на платформе интегрированного планирования In.Plan


Somebody actually bought that $3,000 Steam Deck prototype off eBay, then they let a YouTuber crack it open to see what's inside

Все в шоке: игры, которые взорвут ваш мозг

Тактическая стратегия Spaceland вышла за пределами Apple Arcade

Playdigious портирует лингвистическую головоломку Chants of Sennaar



Во Владивостоке стартовал второй этап Спартакиады ведомственной охраны Минтранса России

В Сочи наградили победителей фестиваля-конкурса национальной патриотической песни «Красная гвоздика» имени Иосифа Кобзона

Relax FM выступит партнером Yoga Day Russia 2025 в музее-заповеднике «Царицыно»

Работники Центрального филиала ведомственной охраны Минтранса России почтили память героев  Великой Отечественной войны, возложив цветы к мемориалам в разных регионах страны




Лавров и Сугионо обсудят расширение политических контактов в Москве 17 июня

Для реализации программы реновации Москва выделила более 50 земельных участков

Во Владивостоке стартовал второй этап Спартакиады ведомственной охраны Минтранса России

Россия рассматривает признание властей Афганистана: Захарова раскрыла детали


"Ъ": основателя сети клиник Alfa Stom подозревают в махинациях в трех странах

Бузулукский родник не зажурчал даже после визита Евгения Солнцева

Путин: Иран не заинтересовался сотрудничеством с Россией в сфере ПВО

Востоковед Супонина: Иран повторит судьбу Ливии после свержения власти


Редкое фото изменившегося Марата Сафина — как сейчас выглядит спортсмен

Повторит ли Кесслер успех в поединке против Чжу Линь? Кесслер — Чжу Линь: прогноз и ставка

Андреева заняла седьмое место в рейтинге WTA

Елена Рыбакина вышла во второй круг турнира WTA-500 в Берлине


CNN: Дональд Трамп пока воздержался от операции против Ирана, но допустил удары

Востоковед Супонина: Иран повторит судьбу Ливии после свержения власти

Новый стиль жизни в Благовещенске — «Зея парк»

Для реализации программы реновации Москва выделила более 50 земельных участков


Музыкальные новости

Концертный Директор для Артистов из Регионов.

Воздушные фаны: AY YOLA в Лужниках, Найк Борзов на VK Fest

В субботу Мурманск поёт Визбора

Могли ли врачи-онкологи спасти Жанну Фриске?



Грозный задал высокую планку: подведены промежуточные итоги статуса Культурной столицы России 2025 года

Во Владивостоке стартовал второй этап Спартакиады ведомственной охраны Минтранса России

Работники Центрального филиала ведомственной охраны Минтранса России почтили память героев  Великой Отечественной войны, возложив цветы к мемориалам в разных регионах страны

Relax FM выступит партнером Yoga Day Russia 2025 в музее-заповеднике «Царицыно»


Ростех заморозит стройку трех заводов: решение Чемезова с Путиным

Вдохновляющий успех: в Усадьбе «Вязёмы» прошел уникальный показ мультфильма «Ай да Пушкин!»

«Кубок Сибири» в Абакане собрал рекордное количество участников

«Реал» сыграл вничью в дебютном матче тренера Алонсо на клубном ЧМ-2025


Получил 13 лет: чем закончилась история с трупом женщины в «Запорожце» Куценко

Подозрительный таксист помог задержать подельника аферистов

В Государственной думе предложили установить отдельные зеленые номера для электромобилей

Депутаты Липецкого облсовета встретили участников автопробега "Дорогами Победы"


Путин сообщил о наличии контактов России с Рубио и Вэнсом

Москва договорилась с Израилем о безопасности россиян на АЭС «Бушер» в Иране

Путин сообщает, что Новый банк развития профинансировал примерно 120 проектов

«На Москву полетят “Томагавки». Спасайтесь!»: Скурлатов обрушился на команду Путина


Международная Премия #МЫВМЕСТЕ объединила социальных лидеров

Прямое железнодорожное сообщение Пхеньян - Москва возобновлено с 17 июня




Более 1000 человек приняли участие в ежегодном благотворительном МедЗабеге

Врач Тяжельников рассказал о Дне Йоги на ВДНХ и пользе физической активности

Премия The Medical Stars & Beauty Awards: отмечая звезд медицины и красоты

Врач-косметолог Мадина Осман: как избавиться от темных кругов под глазами


В Киеве высмеяли Зеленского из-за преследования Трампа

Berliner Zeitung: Сорванная на G7 встреча Зеленского и Трампа стала ударом для Киева

Удар по Киеву: Трамп устал, что ему «подсовывают» Зеленского и сбежал с саммита G7 – Berliner Zeitung

BZ: отмененная встреча Трампа и Зеленского на G7 стала ударом для Киева


Второй этап модернизации школ начался в Москве: у учеников будут медиатеки, новые спортзалы и мягкая мебель для отдыха

Школьные футбольные команды Хакасии поборются за звание лучших в Москве

Во Владивостоке стартовал второй этап Спартакиады ведомственной охраны Минтранса России

«Реал» сыграл вничью в дебютном матче тренера Алонсо на клубном ЧМ-2025


Лукашенко заявил о проблеме, которая может довести Белоруссию до голода



Сергей Собянин: Тоннель проведем под водой

Собянин сообщил о новых памятниках культуры Москвы

Давняя мечта москвичей. Собянин запустил проходку Бирюлевской линии метро

Москва нацелена на технологическую независимость: Собянин и Гарбузов в деле!


СИБУР и Московский музей дизайна открыли в Воронеже фотовыставку «От первого лица»

ОЭЗ Москвы станет ведущим промышленным центром Европы

Правила для парковок электроавтомобилей подготовило МЧС

В Карелии возведут предприятие по производству активированного угля


Востоковед Супонина: Иран повторит судьбу Ливии после свержения власти

Белоусов принял решение. Скандальное детище Шойгу закроют: INSIDER-T

CNN: Дональд Трамп пока воздержался от операции против Ирана, но допустил удары

Анатолий Гарбузов: Предприятия ОЭЗ «Технополис ...


Вечная теплота: интерес туристов к северным регионам вырос в полтора раза

"ЭкоИнтегратор" запаздывает с ликвидацией стихийной свалки мусора в Архангельске

Отделочные работы начались на станции «Народное Ополчение»

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев и Уполномоченный по правам человека в Ненецком автономном округе Екатерина Жданова проведут личный приём жителей Ненецкого автономного округа


Для чего ходить к гинекологу и как часто?

Какой сегодня праздник: 17 июня

Требование капитуляции Ирана и закон о защите русского языка – главное

Поезда из Москвы в Феодосию будут ходить чаще


Юрист объяснил, как поступить, если не возвращают горячую воду

«Антиусталость»: как придать коже лица свежий и отдохнувший вид

Заочное обвинение: Тестю Павла Прилучного вменяют организацию подпольного казино

Новый стиль жизни в Благовещенске — «Зея парк»












Спорт в России и мире

Новости спорта


Новости тенниса
Уимблдон

Сталкер Радукану пытался купить билеты на «Уимблдон» — служба безопасности его заблокировала






Россия обвинила Аргентину в шпиономании после заявлений о "российских шпионах"

Новый стиль жизни в Благовещенске — «Зея парк»

Жители Донского пожаловались на свалку и разбитую дорогу в центре села

Белоусов принял решение. Скандальное детище Шойгу закроют: INSIDER-T