Разработка парсер Python, Selenium, BeautifulSoup4

12.06.2024 13:13

Есть старый парсер, который видимо после обновления капчи, перестал работать корректно

Описание ТЗ парсера

При парсинге используется две библиотеки DrissionPage и BeautifulSoup4. При помощи первой библиотеки осуществляется обход капчи Cloudflare и скачивание HTML-страницы, а при помощи BeautifulSoup4 осуществляется парсинг элементов страницы.

Проблема сейчас - это ошибки при обходе капчи

Решение для которого нужен Python-разработчик с опытом парсинга:

1) Для обхода капчи будет использоваться сервис https://rucaptcha.com/api-rucaptcha

2) Вместо DrissionPage, необходимо использовать Selenium в связке с расширением rucaptcha, то есть переписать код обхода капчи

Стек: Python, Selenium, BeautifulSoup4

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Разработка парсер Python, Selenium, BeautifulSoup4

Новости спорта

Даниил Медведев выступит на турнире категории ATP-250 в Марселе

Все деньги мира. На чем зарабатывает звездная пара Джиган и Самойлова

В Минпромторге озвучили информацию о увеличении производства гражданских беспилотников в России.

Хостел горит на северо-западе Москвы

Над Сирией взошла звезда Давида: Дамаск на расстоянии выстрела, Тегеран под прицелом