Добавить новость
ru24.net
Работа
Август
2024
1 2 3 4 5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Проверяем ключевые слова и парсим результаты, для пайтонистов (python)

0
Пишем скрипт на python.

Есть один сайт, там в одного ip можно проверить 100 ключевых слов в день, без регистрации, в одном запросе макс может быть 50 слов.
На сайте есть капча.

https://serphunt.ru/frequency/
Регион не ставим, галочку оставляем только на Базовая.

Суть вроде очень простая, я тут чет сам пробовал через gpt, но знаний мало, ниже покажу пример.

Суть простая, есть файл там будут в строку ключевые слова на проверку, лежать будет там где и сам скрипт slova.txt.

Запускаем скрипт, он заходит на сайт serphunt.ru/frequency/, надо чтобы еще весь ход выводился, чтоб понятно было что происходит в данный момент, заходим на сайт, там есть поле где вводим ключевые слова, макс делаем, чтоб можно было 50 ввести, если ключевых слов много в текстовом файле, то делим на группы для проверки, в моем примере это уже есть, если ключевых слов меньше, то он будет проверять сколько есть, главное за раз не больше 50, ну и не забываем оставить галочку только на Базовая, нажали проверить, ниже появляется результат и парсим его, первое поле и второе, записываем в текстовый и сохраняем
provereno.txt

----------------------------
Все тож самое, только описано чуть подробнее.
----------------------------

Пишем скрипт на python, со
статистикой, чтобы в коде было видно,
что происходит, зашел ли он на сайт,
заходим на сайт https://serphunt.ru/frequency/,
находим <textarea name="keywordlist"
required="required" class="h300"></textarea>,
добавляем в textarea 50 слов в строку из
файла slova.txt, и нажимаем
кнопку <li class="service-button"><span
id="handler-button"><input type="submit"
class="btn btn-blue button-primary"
value="Проверить"></span></li>,
через какое-то время, ниже появляется
статистика ключевых слов в <table
class="table-zebra w100p">, собираем первый
столбик и второй, первый
<tbody><tr><td>neelakantha</td><td
class="semibold txt-center">0</td>, берем
слово и цифры, и записываем все эти
результаты слов в текстовый файл,
называем его provereno.txt
----------------------------

Все очень просто.
Я думаю даж без селениума можно будет сделать.
Там ведь пост запрос, умельцы думаю смогут отправлять на прямую пост запрос с данными, не пихая слова в textarea.

Жду ваших предложений по цене и по решению данной задачи.
Как бы вы реализовали.
Апи сайта не используем, там нет бесплатных этих 100 проверок.

--------------------
То что я пробовал через gpt
--------------------
import requests
from bs4 import BeautifulSoup
import time

# Функция для чтения слов из файла
def read_words(filename):
with open(filename, 'r', encoding='utf-8') as file:
return [line.strip() for line in file]

# Функция для записи результатов в файл
def write_results(filename, results):
with open(filename, 'w', encoding='utf-8') as file:
for word, frequency in results:
file.write(f"{word}: {frequency}\n")

# Основная функция
def check_word_frequency():
print("Начинаем проверку частотности слов")

# Читаем слова из файла
words = read_words('slova.txt')
print(f"Прочитано {len(words)} слов из файла slova.txt")

# Разбиваем слова на группы по 50
word_groups = [words[i:i+50] for i in range(0, len(words), 50)]

results = []

for group in word_groups:
print(f"Обрабатываем группу из {len(group)} слов")

# Подготавливаем данные для отправки
data = {
'keywordlist': '\n'.join(group),
'source': 'yandex',
'region': '0'
}

# Отправляем POST запрос
print("Отправляем запрос на сервер...")
response = requests.post('https://serphunt.ru/frequency/', data=data)
print(f"Получен ответ от сервера. Статус: {response.status_code}")

# Проверяем успешность запроса
if response.status_code == 200:
print("Успешно получены данные. Начинаем парсинг...")

time.sleep(30)

# Парсим HTML
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find('table', class_='table-zebra')

if table:
# Извлекаем данные из таблицы
for row in table.find_all('tr'):
cols = row.find_all('td')
if len(cols) >= 2:
word = cols[0].text.strip()
frequency = cols[1].text.strip()
results.append((word, frequency))
print(f"Обработано слово: {word}, частотность: {frequency}")
else:
print("Таблица с результатами не найдена на странице")

else:
print(f"Ошибка при получении данных: {response.status_code}")

# Добавляем задержку перед следующим запросом
time.sleep(10)

# Записываем результаты в файл
write_results('provereno.txt', results)
print(f"Результаты записаны в файл provereno.txt. Всего обработано {len(results)} слов.")

# Запускаем основную функцию
if __name__ == "__main__":
check_word_frequency()



Moscow.media
Частные объявления сегодня





Rss.plus



Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

С августа были повышены страховые пенсии более миллиона работающих пенсионеров Москвы и Московской области

Обращение иерея Александра Туховского

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года


Ozon перенес весь модный ассортимент на новую платформу Ozon Fashion

В честь Дня железнодорожника в филиале «Московский» компании «ЛокоТех-Сервис» отметили лучших сотрудников отрасли

Рустэм Султанов возродил в «Звёздном доме» традиции космического поп-рока

7 худших обработанных продуктов, которые разрушают микробиом вашего кишечника и гарантируют вздутие живота: молочные коктейли, бекон и многое другое


India face first defeat in hockey at Paris Olympics against Belgium

Latest Caleb Williams Buzz Indicates The Light Bulb Just Went On

Rewards Drive Mobile Wallet Use for One-Third of eCommerce Shoppers

Man Utd 0 Liverpool 3: Red Devils will hope £36.5m Joshua Zirkzee will have an impact as Prem rivals run riot in US


"Чайф", БАЭС, "Оленьи ручьи": что станет достоянием Среднего Урала?

Вид на Борисоглебский монастырь перед грозой

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года

Торжок


THQ Nordic анонсировал Wreckfest 2 на PC и консоли

Началась предзагрузка Sword of Convallaria на iOS и Android

Don't expect Dragon Age: The Veilguard before October at the absolute earliest

Ранняя версия Summon and Merge 2 доступна в Google Play 1 страны


Міжнародна академія PROeffect Academy запрошує


Рустэм Султанов возродил в «Звёздном доме» традиции космического поп-рока

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества

Обращение иерея Александра Туховского

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года




С августа были повышены страховые пенсии более миллиона работающих пенсионеров Москвы и Московской области

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества

Хиромант рассказал об особенностях науки дерматоглифики

Депутат МГД Перфилова осмотрела строящийся центр для спортсменов в Дмитровском районе


Договора на вывоз мусора проверили в торговых точках Солнечногорска

Инна Святенко встретилась с молодежью в формате «ПолитПикник»

СМИ: певец SHAMAN предсказал победу России в ходе недавнего митинга

Biogen подала иск против «Генериума» из-за российского аналога «Спинразы»


Звёзды мирового тенниса Петрова и Турсунов провели мастер-класс в Елабуге

Российский теннисист Рублев не смог выйти в финал турнира в Вашингтоне

Азаренко вышла в ¼ финала турнира WTA-500 в Вашингтоне

Российские теннисистки Мирра Андреева и Диана Шнайдер проиграли финал Олимпиады, у мужчин золото взял серб Новак Джокович


Сенатор Долгов: В США боятся российских спортсменов, поэтому пытаются их изолировать

Выставка трофейной западной техники из зоны СВО открылась в Тюмени

СК: по делу о хищениях в парке «Патриот» задержан генерал Шестеров

Россия направила в Турцию самолёт для борьбы с лесными пожарами


Музыкальные новости

Ольга Бузова приехала в Алтайский край, чтобы выступить в Яровом

Выставка «Музыкант и меценат» о дирижере Сергее Кусевицком открылась в Мемориальном музее А.Н. Скрябина

Обнародованы жесткие требования организаторов концертов Шнурова

Сергею Шнурову запретили употреблять алкоголь и курить перед концертами



Обращение иерея Александра Туховского

Рустэм Султанов возродил в «Звёздном доме» традиции космического поп-рока

Росгвардейцы устроили участникам летнего лагеря настоящий урок мужества

Филиал № 4 ОСФР по Москве и Московской области информирует: Пенсии работающих пенсионеров начнут индексироваться с 2025 года


"Он опозорил всю семью ". Родные больше не хотят видеть "подрывника" Серебрякова

Юлия Пересильд показала редкое фото с дочерьми в Казахстане

CNN сообщило о роли Харрис в обмене заключенными с Россией

Пожар в супермаркете на юге Москвы потушили на площади 100 квадратных метров


Новые BelGee X50 появились в автопарке каршеринга BelkaCar

Доля КАМАЗа на российском рынке электробусов достигла 96%

В Москве уже тестировали систему фиксации громких выхлопов машин и мотоциклов

Кировская область стала вторым регионом страны по темпам роста цен на бензин


Россия и Запад повторяют кризис 1985-1987 годов, только чем он закончится теперь – договором, как в тот раз, или войной?

Ким Чен Ын не исключил обращения к Москве за помощью из-за наводнения

В годовщину трагедии Хиросимы в Японии обвинили Москву в угрозе применения ядерного оружия





Главный нарколог Москвы Масякин перечислил критерии алкогольной зависимости

Главный нарколог Москвы Масякин назвал критерии алкогольной зависимости

Mash: в клинике «Эталон» мужчине повредили мозг во время пластической операции

Аналитприбор монооксида углерода выдыхаемого воздуха - в списке оснащения кабинетов врачей



В Калмыкии на Открытом турнире по сапсерфингу победителям и призерам вручили 350 тысяч рублей

На трассе «Калининец» прошел очередной этап Чемпионата и Первенства Москвы и МО по кроссу Кубок Kramar Motorsport

Спортсмен из Росгвардии стал бронзовым призером Кубка России по спортивной гимнастике в Новосибирске

Дети и подростки стали главными участниками чемпионата «Камень, ножницы, бумага»




Собянин: Начался монтаж щита-гиганта для прокладки Рублево-Архангельской линии

Собянин рассказал о реставрации московских театров

Сергей Собянин рассказал о реставрации московских театров

Сергей Собянин: Реконструкция Сельскохозяйственной улицы завершится в 2025 году


Пресня станет зеленее

«Группа компаний «ДАФ» подарила Кашире десять контейнеров для раздельного сбора мусора

Эксперт Елисеев рассказал, почему в Москве все чаще появляется радуга

Ким Чен Ын не исключил обращения к Москве за помощью из-за наводнения


Выставка трофейной западной техники из зоны СВО открылась в Тюмени

Bloomberg: Россия может многое потерять из-за ухода премьер-министра Бангладеш, вызванного протестами

Сенатор Долгов: В США боятся российских спортсменов, поэтому пытаются их изолировать

СК: по делу о хищениях в парке «Патриот» задержан генерал Шестеров


Собянин: Начался монтаж щита-гиганта для прокладки Рублево-Архангельской линии

Премьера пространственной симфонии состоялась в Архангельской области

Пять наград завоевали юные туристы из Кемерова на Всероссийском слёте

Из столицы Поморья в Белоруссию стартовал автопробег активистов поискового движения


Жизнь замечательных людей Крыма. Евгений Веремеенко

Цена квадратного метра в Севастополе упала, в Симферополе держится

Выставка-приглашение «Лето книжного цвета: новые книги в библиотеке!»

Выставка-портрет «Мастер исторического и портретного жанра»


По просьбе авиакомпаний. «ОДК-Сатурн» забирает французские детали для двигателей SSJ-100

Опубликованы новые кадры задержания Гершковича и Уилана в России

Болевые точки, или Как мигранты бьют по России: Журналистское расследование

Форвард «Аталанты» порвал крестообразную связку в товарищеском матче












Спорт в России и мире

Новости спорта


Новости тенниса
Большой шлем

Одна медаль на всю страну: Россия осталась с серебром теннисного турнира Игр в Париже






Неделя в Москве: сады и люди, диафильмы и фестиваль Максима Горького

Прокуратуру Лузского района возглавила Елена Метелева

Параспортсмены из Химок стали чемпионами России по академической гребле

Подмосковная служба помощи при ДТП приняла свыше 2 тысяч звонков за неделю