Добавить новость
ru24.net
Все новости
Июнь
2024

Разработка парсер Python, Selenium, BeautifulSoup4

0
Есть старый парсер, который видимо после обновления капчи, перестал работать корректно

Описание ТЗ парсера


При парсинге используется две библиотеки DrissionPage и BeautifulSoup4. При помощи первой библиотеки осуществляется обход капчи Cloudflare и скачивание HTML-страницы, а при помощи BeautifulSoup4 осуществляется парсинг элементов страницы.


Проблема сейчас - это ошибки при обходе капчи


Решение для которого нужен Python-разработчик с опытом парсинга:


1) Для обхода капчи будет использоваться сервис https://rucaptcha.com/api-rucaptcha


2) Вместо DrissionPage, необходимо использовать Selenium в связке с расширением rucaptcha, то есть переписать код обхода капчи


Стек: Python, Selenium, BeautifulSoup4



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Даниил Медведев выступит на турнире категории ATP-250 в Марселе






Все деньги мира. На чем зарабатывает звездная пара Джиган и Самойлова

В Минпромторге озвучили информацию о увеличении производства гражданских беспилотников в России.

Хостел горит на северо-западе Москвы

Над Сирией взошла звезда Давида: Дамаск на расстоянии выстрела, Тегеран под прицелом