Добавить новость
ru24.net
News in English
Июль
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
23
24
25
26
27
28
29
30
31

Web Scraping Wars: How Businesses Are Fighting AI Data Harvesting

0

As web scraping by artificial intelligence (AI) companies intensifies, businesses are grappling with the unauthorized harvesting of their online content, prompting new defensive measures that could reshape the digital landscape. Web infrastructure company Cloudflare has unveiled a new tool against content scraping that could throw a wrench into the gears of major AI companies’ training […]

The post Web Scraping Wars: How Businesses Are Fighting AI Data Harvesting appeared first on PYMNTS.com.

As web scraping by artificial intelligence (AI) companies intensifies, businesses are grappling with the unauthorized harvesting of their online content, prompting new defensive measures that could reshape the digital landscape.

Web infrastructure company Cloudflare has unveiled a new tool against content scraping that could throw a wrench into the gears of major AI companies’ training operations. The software is designed to thwart automated data collection and has the potential to reshape how AI models are developed and trained. As businesses scramble to safeguard their digital assets, industry experts predict a surge in demand for similar protective measures, potentially birthing a new market for anti-AI scraping services.

Data scraping is the automated process of extracting information from websites or other digital sources, often without the explicit permission of the content owners. Companies that generate content are vested in protecting their intellectual property to maintain revenue streams.

“When their information is scraped, especially in near real-time, it can be summarized and posted by an AI over which they have no control, which in turn deprives the content creator of getting its own clicks — and the attendant revenue,” HP Newquist, executive director of The Relayer Group and author of “The Brain Makers,” told PYMNTS.

The financial implications of content scraping are significant. Each company invests considerable resources in researching, writing and publishing website content. Experts say that allowing bots to scrape this material freely undermines these efforts and can create derivative content that potentially outranks the original on search engines.

The Battle Against the Bots

Beyond content theft, scraping can have detrimental effects on website performance. Unchecked bot activity may overload servers, slow down websites and skew analytics data, potentially increasing operational costs. These consequences underscore the urgency of many content providers implementing robust protective measures.

However, experts remain divided about the effectiveness of new anti-scraping tools. While some caution that their track record is still unproven, others are more optimistic about their potential. Cloudflare’s new offering, for instance, leverages advanced machine learning algorithms and behavioral analysis to differentiate between legitimate web traffic and AI bots.

“Its purposeful blockage focuses exclusively on AI bots so that people can still visit the site or search engine robots can continue to crawl it. Search engine optimization (SEO) performance is not compromised, while unauthorized scraping is prevented by selective blocking,” Pankaj Kumar, CEO of Naxisweb, told PYMNTS.

Despite these advancements, challenges persist. Countermeasures are already emerging, with reports of hacks claiming to circumvent Cloudflare’s protection. Moreover, some AI companies may have found workarounds to access protected sites, highlighting the developing nature of this technological arms race.

The rise of generative AI has made web scrapers powerful tools for data extraction, but it’s also raising concerns about intellectual property and competitive intelligence.

“In today’s world, data equates to power. Obtaining data first, refining it and training models differently from competitors is invaluable,” James Foote, technical director at SEO firm Polaris Agency, told PYMNTS.

He noted that many top news sites are now blocking access to AI bots.

“Blocking bots helps maintain ownership, preventing your data from being amalgamated with other sources and potentially diluting your primary research and journalism integrity,” he noted.

Foote also highlighted the complexity behind seemingly simple bot-blocking tools.

“While Cloudflare’s tool may seem straightforward with its ‘toggle switch’ interface, its backend functionality is complex,” he said. “Integrated with Cloudflare’s bot management suite, the tool likely employs Web Application Firewall (WAF), IP fingerprinting, JavaScript challenges and CAPTCHAs to detect and block malicious bot activities. A bot scoring system is also likely used to identify and blacklist suspicious user agents.”

Strategies for Content Protection

For businesses reliant on disseminating information, completely walling off content isn’t viable. Instead, experts recommend a multi-faceted approach to content protection. This includes configuring robots.txt files to guide well-behaved bots, implementing CAPTCHAs at critical access points and employing rate limiting to restrict requests from a single IP address.

Other effective strategies involve periodically altering HTML and CSS code to confuse automated extraction tools, filtering user agents to block known bots, and creating honeytrap pages to catch and identify malicious scrapers.

“By restricting the rate at which requests can be made, you can reduce the impact of scraping bots that attempt to harvest large amounts of data quickly,” Ross Kernez, director of SEO at Mavis Tire, told PYMNTS.

The conflict between content protectors and data scrapers shows no signs of abating. Like the ongoing challenges in computer security, this battle is expected to persist for years. As it unfolds, the tech industry watches closely, recognizing that the outcome could significantly influence how AI models are trained and how online content is valued and protected in an increasingly AI-driven digital landscape.

With tools like Cloudflare’s new offering and other various preventative measures, companies are better equipped to counter unauthorized scraping while safeguarding their content and maintaining site performance. However, as AI technologies evolve, so must the strategies to protect valuable digital assets.

The post Web Scraping Wars: How Businesses Are Fighting AI Data Harvesting appeared first on PYMNTS.com.




Moscow.media
Частные объявления сегодня





Rss.plus



Певец Дмитрий Камский готовит к релизу новый сингл "Песня Земли"

Бренд экологичной одежды первым в мире сообщил о нападении анти-эко-активисток

Москва слезам не верит: в ТПП РФ подержали инициативу по защите прав предпринимателей

19 июля: какой сегодня праздник, что было в этот день


Потеря слуха и её последствия: как справиться с проблемой

Стиль бохо для жаркого лета: примеры ярких образов

Ростовский ЭРЗ Желдорреммаш в 4,2 раза увеличил объем ремонта электровозов серии 2ЭС5К «Ермак».

Подбор летних шин на авто: важные критерии и рекомендации


England U20 overpower France to be crowned world champions

Faculty of International Journalism and Mass Communications Eurasian International University is conducting an additional intake of applicants!

Biden's anger bleeds through as party weighs his future

Suspect arrested for ‘threatening to kill Trump and his VP pick JD Vance’ in Florida days after assassination attempt


Малышу стало плохо — пришлось пересаживать в машину полиции (видео)

Певец Дмитрий Камский готовит к релизу новый сингл "Песня Земли"

На мосту в створе улицы Мясищева ведется гидроизоляция

Владислав Овчинский: жители дома на Радужной улице начали переезд в новостройку по программе реновации


Двадцать пять человек за одним столом под звуки караоке – это было шедеврально!

Интервью AppTime с компанией Innova: релиз Gran Saga в России, внутриигровая оплата и «Масленица» в корейской MMO

According to BioWare, Dragon Age: The Veilguard is the first entry in the series where "the combat's actually fun" and where characters are "intentionally" the focus of the storytelling, which seems pretty unfair on the first three games

Today's Wordle answer for Saturday, July 20


Фотомагазин PYN: ваш надійний партнер у світлі та фотографії


В регионах Центральной России продолжаются мероприятия в рамках ведомственной акции «Каникулы с Росгвардией»

Отрытый конкурс красоты и таланта «Одна на миллион»

Прощай, ЕС! Россия будет поставлять газ в Иран по сверхмощному трубопроводу

«Спартак» проиграл в первом матче РПЛ под руководством тренера Станковича




Владислав Овчинский: жители дома на Радужной улице начали переезд в новостройку по программе реновации

Певец Дмитрий Камский готовит к релизу новый сингл "Песня Земли"

Адвокат Горшков: арест блогера Била не остановит его от новых пранков

"Известия": нелегальные сервисы по "пробиву" людей используют для шантажа


Песков о выходе Байдена из гонки: для Кремля в приоритете достижение целей СВО

Отрытый конкурс красоты и таланта «Одна на миллион»

Красота православных храмов (#427)

Адвокат Горшков: арест блогера Била не остановит его от новых пранков


Красноярскую теннисистку Мирру Андрееву допустили на Олимпиаду в Париже

Шнайдер прошла в финал турнира WTA в Будапеште

Теннисистка Мария Шарапова снялась без макияжа и укладки

Медведев в матче против Синнера на Уимблдоне проявил характер, заявил Ольховский


Газорегуляторный пункт «Кунцево 95» будет реконструирован

Отрытый конкурс красоты и таланта «Одна на миллион»

Умер актер из сериала «Московская борзая» Владимир Королёв

Открытие нового театрального сезона в Театре на Таганке


Музыкальные новости

Тимати, МОТ, «Руки Вверх!» и 205 000 гостей: в России прошел VK Fest. Как это было?

Дистрибьюция Музыки.

Юрий Лоза о «Спартаке»: «Каждый год болельщики верят в чемпионство, но его нет. Идеальный тренер – бывший спартаковец. Станкович будет ставить югославский футбол»

«Бах vs Шопен под величественными сводами Петрикирхе



Отрытый конкурс красоты и таланта «Одна на миллион»

Связисты Росгвардии рассказали о службе в зоне проведения СВО

В регионах Центральной России продолжаются мероприятия в рамках ведомственной акции «Каникулы с Росгвардией»

Прощай, ЕС! Россия будет поставлять газ в Иран по сверхмощному трубопроводу


Собянин объявил о начале строительства станции метро "Рублево-Архангельское"

Экс-глава «Яндекса» Волож заявил об отсутствии связей с Россией

Гроссмейстер из Бурятии Жамсаран Цыдыпов продолжает лидировать на турнире «Moscow Open – 2024», набрав 6,5 очков после 7 туров, на пол-очка отстают Борис Савченко, Сергей Волков и Владимир Захарцов

Прощай, ЕС! Россия будет поставлять газ в Иран по сверхмощному трубопроводу


Еще один китайский кроссовер планируют собирать в России: что это за модель?

Собянин рассказал о создании пешеходных зон у причалов столицы

Собянин сообщил о планах по созданию пешеходных зон возле причалов Москвы

Мотоцикл загорелся в результате столкновения с авто на Киевском шоссе


Гениальный ход: Путин переиграл НАТО. Йеменцы прибыли в Москву с интересным предложением. США в панике готовят флот и авиацию

Александр Немец: из Пекина в Москву пришло жесткое указание "Вон из Беларуси!"

Путин заверил Асада в поддержке РФ властей Сирии в отстаивании суверенитета

Bloomberg: В НАТО увидели новую угрозу в российских ледоколах





Волшебный гормон похудения: что есть для уменьшения объемов тела

Бизнесмен вакцинировался от суда // Дело об особо крупной растрате рассмотрят в заочном режиме

Источник 360.ru: 2 девушки попали в больницу после ДТП-перевертыша в Москве

В Москве ребенок попал в больницу с сотрясением мозга после удара огурцом


Кличко: любой шаг Зеленского чреват политическим суицидом

Кличко снова разнёс Зеленского и предрёк ему политическое самоубийство

В Киеве из-за незаконного сноса Дома Зеленских XIX века возбудили уголовное дело

Зеленский сдал Байдена и делает ставку на Трампа


«Спартак» проиграл в первом матче РПЛ под руководством тренера Станковича

Минеев единогласным решением судей победил Исмаилова на турнире в Москве

Ефимов: 5 тысяч детей обучились во Дворце спорта и образования Ирины Винер

Экс-игрок Мостовой: в матче с "Акроном" я увидел обычный "Локомотив"


В Белоруссии заявили, что Лукашенко может помиловать некоторых участников протестов

Александр Немец: из Пекина в Москву пришло жесткое указание "Вон из Беларуси!"



Сергей Собянин. Главное за день

Собянин рассказал о жизни Московского международного дома музыки

Собянин: Началось строительство подъездной дороги к станции Кокошкино МЦД-4

Собянин рассказал о создании пешеходных зон у причалов столицы


Бренд экологичной одежды первым в мире сообщил о нападении анти-эко-активисток

Богомолу и осе комфортно в нашей полосе: почему в Москве появились необычные насекомые

Запчасти выходят на второй круг


Заменитель Mercedes-Benz S-класса от Hongqi получит новый мотор специально для России. Под капотом Hongqi H9+ пропишется 3,0-литровый V6

"Известия": нелегальные сервисы по "пробиву" людей используют для шантажа

В Москве состоялся открытый кастинг конкурса "Мисс Россия 2024"

SHAMAN считает, что Байден вышел из гонки после его выступления у посольства США


Собянин объявил о начале строительства станции метро "Рублево-Архангельское"

Спортсмен из сборной Архангельской области стал победителем масс-старте в Малиновке

В Архангельске стартовала Соловецкая регата

АО «Транснефть - Север» обеспечивает надежность производственной инфраструктуры в четырех регионах


В чем особенность приготовления лапши вок?

Час духовности «Приняла крещенье Русь»

Бойцовые собаки чуть не растерзали женщину в Севастополе

Выставка-персоналия «Замечательный русский беллетрист» к 250-летию со дня рождения М.Н.Загоскина, русского писателя и драматурга


В Москве состоялся открытый кастинг конкурса "Мисс Россия 2024"

Открытие нового театрального сезона в Театре на Таганке

Умер актер из сериала «Московская борзая» Владимир Королёв

Песков о выходе Байдена из гонки: для Кремля в приоритете достижение целей СВО












Спорт в России и мире

Новости спорта


Новости тенниса
Ролан Гаррос

Красноярскую теннисистку Мирру Андрееву допустили на Олимпиаду в Париже






В Финляндии начались военные учения у границы с Россией

Отрытый конкурс красоты и таланта «Одна на миллион»

Бербок заявила, что было бы наивно отказаться от размещения в стране ракет США

В Москве начали строить дорогу к станции МЦД Кокошкино