Разработать программу для анализа комментариев по собранному датасету
Данная программа будет использоваться для создания датасета из жалоб жителей, каких-то их вопросов к власти регионов, сбора мнений и тд.
Конкретно требуется определить тематику поста, которая будет использоваться потом в интересах любых лиц, принимающих решения (по типу здравоохранение, политика, инфраструктура и тд). Необходимо связать текст комментария и текст поста, вычленить только нужные комментарии, в которых есть какая-то критика или тому подобное (то есть как люди при помощи комментариев обращаются за помощью или задают вопросы, или высказывают недовольство). Необходимо сделать краткое содержание поста (5-10 слов) и краткое содержание комментария (также 5-10 слов по необходимости).
Выходной csv файл должен содержать заголовки (Тематика поста,Краткое содержание поста,Краткое содержание комментария,Пост,Текст комментария,Дата поста,Имя Фамилия,ID пользователя).
Вкратце: нужно определить реакцию комментаторов на текст поста. Выявить ключевые вопросы от каждого комментария, если это возможно. И разбить по тематикам