Добавить новость
Главные новости Москвы
Москва
Май
2020

Парсинг сайтов объявлений

0

Добрый день!

Нужен парсер для сайта объявлений (сбор заголовков, текста, телефонов, емейлов). Региональность — Россия, Украина, Казахстан, Беларусь, язык русский.

После парсинга данные нужно проанализировать на предмет наличия ключевых слов и сформировать список тегов к каждому объявлению в соответствии с ключевыми словами.

По итогам сбора выбрать наиболее длинные по количеству символов объявления и записать их во внешнюю БД.

Данные собираются с двух (трех — если можно обойти Google Captcha) сайтов. БД для сбора/записи PostgreSQL.

Важное замечание: сбор предполагает данные для взрослых (знакомства, категория 18+), поэтому широкий кругозор и толерантность исполнителя являются таким же важным фактором как и опыт парсинга данных.




Москва на Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в Москве

Новости спорта


Новости тенниса
Михаил Кукушкин

Михаил Кукушкин удачно стартовал на турнире во Франции






BRandICE приглашает отпраздновать Международный день эскимо и дарит вкусные скидки

Лекция о профессиях будущего в IT состоится 29 января в Московском дворце пионеров в ЮЗАО

WP сообщила о намерении ЕС ослабить препятствующие восстановлению Сирии санкции

Расшифровка дела А.С. Пушкина, СПАСЕНИЕ ОТ ДЕНУКЛЕАРИЗАЦИИ ВОЗМОЖНО! Видео! Доработка "Орешника". В.В. Путин, Д.Ф. Трамп. Новости. Россия, США, Европа могут улучшить отношения и здоровье общества?!