Добавить новость
ru24.net
Все новости
Ноябрь
2024

Парсинг динамических сайтов без API каждый час

0
Парсинг билетных операторов (Яндекс Афиша, Кассир ру и т.д.) для отслеживания динамики продаж билетов у конкурентов.

Нужно:
1. Парсить количество проданных билетов в час
2. Раз в день парсить заполнение ценовых сегментов (
3. Парсить все номера мест и номер ряда с пометкой продан он или нет
4. Придумать какую-то визуализацию для (если можно настроить в гугл таблицах, то отлично - графики, дашборды в идеале) - просто excel \ csv с данными для нас не релевантен.
5. Предусмотреть отсутствие дублей. Все сайты работают через 1 шлюз, поэтому не имеет смысл парсить одно мероприятие и с Афиши и с Кассир ру) - тот, что проще парсится, тот и используйте
6. Парсер должен работать стабильно и не блокироваться (т.к. запросов будет много, потому что сканировать нужно более 10 городов, то необходимо предусмотреть прокси)

Дедлайн 10 дней



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Александр Бублик

Крик сына помешал Бублику. Казахский теннисист попросил семью покинуть трибуны






На оперативном совещании в администрации Щелкова обсудили сферу образования

Правительство ЧАО планирует субсидировать стоимость билетов между Певеком и Новосибирском

Роскошь для миллионеров: названа средняя цена нового авто в России

В Москве отобрали участников пятого потока "Академии инноваторов"