Добавить новость
ru24.net
Все новости
Март
2024

Модифицировать python код для парсинга изменений на сайте

0
Имеется скрипт на python который производит парс изменений сайта и складывает их в файл, но изменения не удобочитаемые, также в изменения записываются лишние значения, например id метрики которые обновляются каждый заход на страницу.
Задача изменить/переписать скрипт для мониторинга изменений на сайте.
1.Добавить почтовый модуль(простейший MIMO для отправки уведомлений по типу if изменения есть, то отправить на ящик письмо что появились изменения и файл изменений вложением(например txt))
2.Верно наладить мониторинг.
Систему "txt" можно оставить, но нужно чтобы если появились изменения txt переписывался с изменений, чтобы была ротация.
3. Сделать изменения читаемыми.
Чтобы можно было понять что именно поменялось на сайте.
В данный момент используется гугловский модуль diff_match_patch его можно оставить или заменить, на ваше усмотрение.
4. Проверить ссылки, думаю что вынул все без дублей, но лучше проверить есть-ли еще ссылки на сайте и добавить в список.
Самому доделать уже не хватает компетенций и времени.
Архив с наброском выдам при положительном решении.
Быстрым повышу оплату.



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Алькарас сыграет на турнире ATP-500 в Токио в сентябре. Он не будет защищать титул Пекина






Аномальная зима: Москва ставит температурные рекорды в январе

Столичные врачи прооперировали руку ребенка с двумя большими пальцами

Беременная дочь Заворотнюк вернулась в Дубай — не будет рожать в Москве

Горожанам расскажут о правилах возведения некапитальных объектов