Создать программу на Selenium + Python для взаимодействия сайтом
Суть программы - получать капчу, распознавать её через сервис и оправлять на сайт.
Буду использовать программу для сбора датасета изображений и для других целей.
Что надо сделать?
- Регистрацию делать не надо, считайте что у вас на вход есть связки прокси (предоставлю) и аккаунтов. Считаем, что аккаунты регистрируются руками.
- Авторизацию через recaptcha.
- Прохождение "обучения" - там серия примеров капчи с фиксированным порядком ответов.
- Работаем на бирже как работник. Имитируем его работу, получаем капчу, отправляем на сервис для распознавания, получаем ответ и вводим его.
- Отработать ситуации, когда отваливается прокси, не успели получить ответ с распознанной капчёй, капча не понятного формата / битая, вместо текстовой капчи идёт капча с кликами и другие ситуации.
- Отработать ситауции когда ошибки возникают и их надо исправить. Скипнуть капчу через кнопку "невозможно распознать" и методом старт/стоп.
- В случае бана аккаунта написать, что забанен в логи и прекратить работу.
- Изображение и полный запрос с информацией (используем selenium-wire для получения запросов браузера) пишем в логи / базу, на худой конец в текстовый файл.
- Писать логи в файл, по максимуму разобрать все возникающие проблемы.
Цель - чтобы стабильно работало неделю. Нужен не прототип, который отработает час, а именно разобрать все возможные ситуации, здесь нужно запустить скрипт и ждать пока что-то необычное произойдет и отработать такие ситуации.
По доработкам: буду требовать в рамках разумного, при сильном выходе за рамки скоупа доплата.
P.S.> Если сделаете всё на requests, без применения Selenium и браузера, то +20000 руб бонус.
Тг onemorelayer