Добавить новость
ru24.net
Все новости
Март
2023

Создать краулер парсер для сохранения информации и поиска запросов

0
1. Нужно сделать так, чтобы:

1.1. на компьютер сохранялись pdf-файлы из определенных диалогов в телеграмме в формате word;

1.2. на компьютер сохранялись pdf-файлы с определенных сайтов в формате word (ссылки на сайты предоставлю при обсуждении задания).


2. Далее из этих файлов надо сделать так, чтобы:

2.1. по запросу на определенную тему создавались отдельные файлы в формате word со статьями из скачанных pdf-файлов. Грубо говоря, информация находилась по хэштегу и сохранялась в отдельном файле.

или

2.2. в названии газеты присваивался хэштег, чтобы по нему можно было потом найти статью.


3. А также сделать так, чтобы:

независимо от меня ежедневно отслеживались новости в интернете по заданной теме и сохранялись на компьютер в файлах формата word.


Я вижу это в формате телеграмм-бота, где:
1. я могу направлять запрос на исполнение одной из вышеперечисленных функций.
2. он будет предлагать еженедельную выгрузку вышеперечисленных функций.

Сейчас я все это делаю вручную. Готов рассмотреть предложения по форматам
Насколько я понимаю можно использовать это: https://blog.apify.com/top-11-open-source-web-craw...

По срокам не горит. В течение месяца приемлемо.
Бюджет предлагайте.



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Андрей Рублёв поднялся на восьмое место в обновлённом рейтинге ATP






Блиновская спокойно отреагировала на приговор к пяти годам колонии

В Россию привезли гибридный седан Voyah Passion EVR

В Петербурге женщина получила шесть лет колонии за организацию проституции

Без отрыва от внешнего мира