Добавить новость
ru24.net
News in English
Декабрь
2024

The startup trying to turn the web into a database

0

A startup called Exa is pitching a new spin on generative search. It uses the tech behind large language models to return lists of results that it claims are more on point than those from its rivals, including Google and OpenAI. The aim is to turn the internet’s chaotic tangle of web pages into a kind of directory, with results that are specific and precise.

Exa already provides its search engine as a back-end service to companies that want to build their own applications on top of it. Today it is launching the first consumer version of that search engine, called Websets.  

“The web is a collection of data, but it’s a mess,” says Exa cofounder and CEO Will Bryk. “There’s a Joe Rogan video over here, an Atlantic article over there. There’s no organization. But the dream is for the web to feel like a database.”

Websets is aimed at power users who need to look for things that other search engines aren’t great at finding, such as types of people or companies. Ask it for “startups making futuristic hardware” and you get a list of specific companies hundreds long rather than hit-or-miss links to web pages that mention those terms. Google can’t do that, says Bryk: “There’s a lot of valuable use cases for investors or recruiters or really anyone who wants any sort of data set from the web.”

Things have moved fast since MIT Technology Review broke the news in 2021 that Google researchers were exploring the use of large language models in a new kind of search engine. The idea soon attracted fierce critics. But tech companies took little notice. Three years on, giants like Google and Microsoft jostle with a raft of buzzy newcomers like Perplexity and OpenAI, which launched ChatGPT Search in October, for a piece of this hot new trend.

Exa isn’t (yet) trying to out-do any of those companies. Instead, it’s proposing something new. Most other search firms wrap large language models around existing search engines, using the models to analyze a user’s query and then summarize the results. But the search engines themselves haven’t changed much. Perplexity still directs its queries to Google Search or Bing, for example. Think of today’s AI search engines as a sandwich with fresh bread but stale filling.

More than keywords

Exa provides users with familiar lists of links but uses the tech behind large language models to reinvent how search itself is done. Here’s the basic idea: Google works by crawling the web and building a vast index of keywords that then get matched to users’ queries. Exa crawls the web and encodes the contents of web pages into a format known as embeddings, which can be processed by large language models.

Embeddings turn words into numbers in such a way that words with similar meanings become numbers with similar values. In effect, this lets Exa capture the meaning of text on web pages, not just the keywords.

A screenshot of Websets showing results for the search: “companies; startups; US-based; healthcare focus; technical co-founder”

Large language models use embeddings to predict the next words in a sentence. Exa’s search engine predicts the next link. Type “startups making futuristic hardware” and the model will come up with (real) links that might follow that phrase.

Exa’s approach comes at cost, however. Encoding pages rather than indexing keywords is slow and expensive. Exa has encoded some billion web pages, says Bryk. That’s tiny next to Google, which has indexed around a trillion. But Bryk doesn’t see this as a problem: “You don’t have to embed the whole web to be useful,” he says. (Fun fact: “exa” means a 1 followed by 18 0s and “googol” means a 1 followed by 100 0s.)

Websets is very slow at returning results. A search can sometimes take several minutes. But Bryk claims it’s worth it. “A lot of our customers started to ask for, like, thousands of results, or tens of thousands,” he says. “And they were okay with going to get a cup of coffee and coming back to a huge list.”

“I find Exa most useful when I don’t know exactly what I’m looking for,” says Andrew Gao, a computer science student at Stanford Univesrsity who has used the search engine. “For instance, the query ‘an interesting blog post on LLMs in finance’ works better on Exa than Perplexity.” But they’re good at different things, he says: “I use both for different purposes.”

“I think embeddings are a great way to represent entities like real-world people, places, and things,” says Mike Tung, CEO of Diffbot, a company using knowledge graphs to build yet another kind of search engine. But he notes that you lose a lot of information if you try to embed whole sentences or pages of text: “Representing War and Peace as a single embedding would lose nearly all of the specific events that happened in that story, leaving just a general sense of its genre and period.”

Bryk acknowledges that Exa is a work in progress. He points to other limitations, too. Exa is not as good as rival search engines if you just want to look up a single piece of information, such as the name of Taylor Swift’s boyfriend or who Will Bryk is: “It’ll give a lot of Polish-sounding people, because my last name is Polish and embeddings are bad at matching exact keywords,” he says.

For now Exa gets around this by throwing keywords back into the mix when they’re needed. But Bryk is bullish: “We’re covering up the gaps in the embedding method until the embedding method gets so good that we don’t need to cover up the gaps.”




Moscow.media
Частные объявления сегодня





Rss.plus




Джиджи Хадид снялась в бикини для модного бренда

Саймон Купер: человек, который заставил футбол заговорить по-новому

ГК «ДИАКОН» представляет современные решения лабораторной диагностики на XI Международном конгрессе «Санаторно-курортное лечение»

Клубный дом Моне - жилой комплекс, вдохновленный искусством


EuroMillions jackpot rolls over to £185,000,000 after no one claims ticket

Australia approves 40-year extension for contentious gas plant

European Darts Open 2025: Schedule and results as Nathan Aspinall and Stephen Bunting head stacked field

Gap says Trump’s tariffs could cost the company a whopping $300 million, sending shares into a tailspin


Сына дагестанского чиновника арестовали в Саратове за совершение смертельного ДТП, с которого он скрылся

В Тверской области прошёл благотворительный концерт «Культура в помощь Донбассу»

Управляйте климатом и безопасностью своего авто с помощью смартфона

В российском регионе обнаружили иностранца, который 15 лет не вставал на воинский учет


Началась предзагрузка Crystal of Atlan на PC и смартфонах

Игра Cultivation Chat Group заняла топ-7 в китайском App Store

The Kingmakers system requirements show that the hardest part of running the game may be finding 80 GB free for the install

This underwater city builder had me more emotionally invested in my corals than SimCity does in my human citizens, and you can try it at the next Steam Next Fest



Культура на русском. Креативные индустрии 5.0

Севастополь снова встречает детский благотворительный фестиваль «Добрая волна»

Покупки для детей в ТРЦ «Нора»

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»




ОГРОМНЫЙ ПОЛИТИЧЕСКИЙ СКАНДАЛ: США И СССР ПОДГОТОВИЛИ СНОС...США. СЕНСАЦИЯ! Важные новости! В.В. Путин, Дональд Трамп, Илон Маск. Россия, США, Европа могут улучшить отношения и здоровье общества?!

Фургоны Mercedes-Benz вернулись в Россию

Губерниев обозначил фаворита в суперфинале Кубка России

"Финны сделать ничего не могут. "Бастион" встанет в 40 км": Москва показала жесткую готовность ответить


В Нижнекамске представили издание к 50-летию шинного производства

Вымершую птицу Додо «воскресили» в Московском зоопарке

Авария с участием нескольких автомобилей произошла на улице Онежская

Удача на стороне блондинок: жительница Рязани выиграла 2 миллиона и обрела финансовую уверенность


Монфис совершил камбэк с 0-2 и пробился во второй раунд "Ролан Гаррос"

Касаткина победила Бадосу и вышла в 1/8 финала «Ролан Гаррос»

Елена Рыбакина вышла в третий круг Открытого чемпионата Франции — 2025

Карлос Алькарас на защите парижского трона Ролан Гаррос


Авария с участием нескольких автомобилей произошла на улице Онежская

Роспотребнадзор составил список зон, где можно купаться и отдыхать летом в Москве

Среди обвиняемых в торговле детьми оказались главврачи частных клиник Приморья

В Москве задержан африканский «маг», обещавший превратить бумагу в доллары


Музыкальные новости

"Певица деградирует": эксперт раскритиковала новый образ Глюкозы

Игорь Бутман представит Россию на международном джазовом фестивале в Анталье

Объявлены даты и программа Летнего фестиваля Дениса Мацуева в Суздале

Том Йорк написал саундтрек для сериала «Дым» с Тэроном Эджертоном и Джерни Смолетт



ВЦ «Раздолье» и «1С» подвели итоги проекта импортозамещения ПО в компании GRASS

Форум «Прикладное применение ИИ и робототехники в бизнесе и промышленности»

Культура на русском. Креативные индустрии 5.0

Покупки для детей в ТРЦ «Нора»


IX Открытый Московский фестиваль конного искусства и спорта

Сергей Собянин: В Москве более 65 компаний в проекте «Техностажировка»

Суд ограничил доступ к видео на YouTube с ответами на ЕГЭ 2025 года

Три предпринимателя из Ростовской области стали победителями всероссийского конкурса Сбера


Ефимов: в Западном Дегунине около 700 горожан осматривают жилье по реновации

В Москве на Онежской улице из-за массового ДТП образовалась пробка

"Авито" запустил онлайн-бронирование такси в Москве и Санкт-Петербурге

Владимир Ефимов: В Западном Дегунине около 700 горожан приступили к осмотру жилья по программе реновации


Для участников специальной военной операции обеспечат возможность поступления на муниципальную службу

Путин поручил меры по сохранению памяти о защитниках Родины

Визит вдовы Абэ к Путину подарил надежду в нормализацию отношений России и Японии

Неожиданное заявление о Трампе от западных аналитиков: считают ли они заслугой Путина?


Новые условия безвиза планируют согласовать в июне Россия и Китай

Правительство США утвердило новую вакцину против COVID-19 для применения




Правительство США утвердило новую вакцину против COVID-19 для применения

Косметолог Никитенко назвала бьюти-процедуры, которые можно делать во время беременности

Офтальмолог Шкатова назвала болезни глаз, которые «подкрадываются» незаметно

Московских врачей заманили на работу в Волгоградскую область


Зеленский совершил очередную хамскую провокацию


В Центральном округе Росгвардии проходят мероприятия ко Дню защиты детей

Саймон Купер: человек, который заставил футбол заговорить по-новому

Чемпионат по игре «Камень, ножницы, бумага» пройдет в рамках «Лета в Москве»

Андреева пробилась в четвертьфинал «Ролан Гаррос»




Сергей Собянин: В Москве более 65 компаний в проекте «Техностажировка»

Сергей Собянин назвал имена победителей профессионального конкурса для учителей

Мэр Москвы наградил лучших учителей Москвы

Собянин поблагодарил московских спасателей за труд и профессионализм


Какие ягоды из Красной книги есть в лесах Подмосковья и что грозит за их сбор

За сутки в России было ликвидировано 44 природных пожара

Лучшие приложения для того, чтоб отслеживать экологическую обстановку

В Бахчисарайском парке родились редкие животные и птицы


Вымершую птицу Додо «воскресили» в Московском зоопарке

Удача на стороне блондинок: жительница Рязани выиграла 2 миллиона и обрела финансовую уверенность

Роспотребнадзор составил список зон, где можно купаться и отдыхать летом в Москве

Опера в Рыбинске!


Жаркое, дождливое и опасное: какое лето ждет россиян

Архангельские гребцы завоевали две медали на первенстве России в Краснодаре

Город будущего — в твоих руках: жители Архангельской области выбирают, какие места благоустроят к 2026 году

Арктика с женским лицом: Архангельск готовится к масштабному форуму лидеров и идей


Клубный дом Моне - жилой комплекс, вдохновленный искусством

Из Петербурга будут ходить регулярные автобусы в Геленджик и Симферополь

«Поэма» в сердце города: новый уровень жизни в центре Симферополя

Встреча друзей «Библиотека – волшебное место, где книгам не скучно, где всем интересно».


Опера в Рыбинске!

В Москве задержан африканский «маг», обещавший превратить бумагу в доллары

«Алексеевские перезвоны 2025» пройдут в честь Великой Победы и духовных традиций

Роспотребнадзор составил список зон, где можно купаться и отдыхать летом в Москве












Спорт в России и мире

Новости спорта


Новости тенниса
Уимблдон

Российская теннисистка Селехметьева уступила чемпионке Уимблдона в первом круге «Ролан Гаррос»






Авария с участием нескольких автомобилей произошла на улице Онежская

МосгорБТИ обследовало более трех тысяч квартир в домах по программе реновации с начала года

Среди обвиняемых в торговле детьми оказались главврачи частных клиник Приморья

Кабмин РФ обсудил изменения в порядок регистрации кандидатов на выборах