Добавить новость
ru24.net
«Фрилансим»
Январь
2025
1 2 3 4 5 6 7 8 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Парсинг сайта

0
Сбор и обработка данных с сайта Dili360 через подборку Baidu
Dili360 – тревел-сайт

Собрать тексты с сайта Dili360 (через подборку по ссылку в Baidu), извлечь актуальную туристическую лексику, статьи и ключевые фразы, чтобы предоставить данные для анализа. Все дальнейшие анализы частотности, структуры предложений и стиля текста выполнит нейросеть (ChatGPT).

Этапы работы:
1. Сбор ссылок из подборки Baidu
2. Сбор текстов с сайта Dili360
3. Очистка данных
4. Структурирование данных


Итоги работы:
• Все релевантные тексты с сайта собраны.
• Итоговый объем данных составляет не менее 5000 уникальных фраз.
• Данные очищены и структурированы.
• Файлы подготовлены для загрузки и анализа.

Во вложении подробное ТЗ



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
Горан Иванишевич

Иванишевич впервые прокомментировал скандал вокруг Рыбакиной и Вукова






Гидрометцентр сообщил, что в четверг в Москве будет гололедица и до 2°C

Синоптики рассказали о волнах тепла весной 2025 года

В столице Чада террористы атаковали президентский дворец

Что важно учесть при обустройстве детской: советы эксперта