Мы в Telegram
Добавить новость
ru24.net
Работа
Июнь
2021

Перейти по всем ссылкам в sitemap.xml в ubuntu

0
Реализовать на баше crawling по всем ссылкам в sitemap.xml во вложенных sitemap.xml https://bit.ly/3iQiG5j.

Т.е внутри xml, есть еще несколько xml, нужно получить ссылки со всех вложенных xml созданных yaost seo, а потом перейти по ним, при этом нужно после загрузить 100 файлов удалить загруженное и потом парсить дальше.
С файлами ничего делать не нужно, нужно просто загрузить их (прогреть кеш) и удалить.. ежедневно в 3 часа ночи должен запускаться cron)
Используйте user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKi t/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36’




Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
ATP

Российский теннисист поднялся на две позиции в топ-10 рейтинга ATP






Визажист Феокстистова рассказала, как подобрать оттенок помады

На высоком уровне. На KazanForum зарегистрировались 11 тысяч человек

Выставка к 245-летию МИИГАиК открылась на станции метро «Воробьевы горы»

Московский НПЗ «Газпром нефти» вошел в пятерку лучших работодателей России