Идея: анализ упоминаний и тематик в СМИ #25

dractw · 2019-12-02T14:37:18Z

ref to #10

Анализ новостных лент по тегам и ключевым словам, для составления инфографики по текущей и/или исторический активности СМИ по конкретной теме или подтексту, с определением характера упоминаний - положительный, отрицательный, нейтральный.

dractw · 2019-12-02T18:41:37Z

ref to #10
Анализ новостных лент по тегам и ключевым словам, для составления инфографики по текущей и/или исторический активности СМИ по конкретной теме или подтексту, с определением характера упоминаний - положительный, отрицательный, нейтральный.

Действительно нужное приложение, часто бывает нужно оценить охват аудитории после акции чтобы понять результативность и заинтересованность населения,
Обычно это делается в ручную, собирается информация за 7 дней и считаются все просмотры

К этой идее меня больше всего подталкивает возможность определять так называемую информационную травлю или наоборот пропаганду, т.к не редки случаи, когда, нейтральной по своей сути, информации, с помощью неопределённого круга СМИ и в каких либо локальных интересах, предаётся резко негативная окраска, либо наоборот, крайне положительная.

aurman21 · 2019-12-04T19:46:42Z

окей, вопрос, откуда брать сами новостные ленты? ну и чтобы мониторить в режиме реального времени нужен ресурс (в плане денег на сервер, где все это будет хоститься)
типа как вариант - скрейпить те же яндекс новости в реальном времени (+-), потому что большая часть пропагандистских сми все равно там упоминается. потом гнать что-нибудь, что будет выделять негативный сентимент+схожесть тем (наверное тоже в реальном времени? вот тут нужен ресурс. ну или апдейтить раз в день-раз в Н часов), и таким образом выделять вероятные стримы онлайн-травли (условно, таким образом можно зацепить, что много пропагандистских сми разом пишут негатив, допустим, про какого-то оппозиционного политика, то есть видимо организованная травля). небольшая проблема, которую я вижу сразу - определение сентимента (эмоциональной окраски) на русскоязычных текстах (насколько у меня есть опыт) работает так себе, но это +- решаемо (так себе, но работает же :)

dractw · 2019-12-05T07:36:09Z

@aurman21

окей, вопрос, откуда брать сами новостные ленты?

Вариантов более чем достаточно, публичные API новостных агрегаторов (в т.ч. ЯН), парсинг RSS-лент, это только то, что пришло в голову.

ну и чтобы мониторить в режиме реального времени нужен ресурс (в плане денег на сервер, где все это будет хоститься)

В реальном времени - имеется в виду следить за обновлением того или иного источника? Можно и так, но мне видится более реальным и менее трудоемким использовать интервалы апдейта. На начальном этапе VDS под это дело будет стоить чуть дороже, чем бесплатно. :)

небольшая проблема, которую я вижу сразу - определение сентимента (эмоциональной окраски) на русскоязычных текстах (насколько у меня есть опыт) работает так себе, но это +- решаемо (так себе, но работает же :)

Тут ничего не могу сказать, никогда ничего подобного не делал, но тропинка уже протоптана и работа проделана, осталось только с ней ознакомиться и применять на практике.
http://www.dialog-21.ru/digests/dialog2013/materials/pdf/AntonovaAJ.pdf
http://www.dialog-21.ru/digests/dialog2011/materials/ru/pdf/50.pdf

sasha110110 · 2019-12-06T18:29:23Z

уже на самом деле довольно много даже предобученных моделей на хорошо-плохо, так что мне кажется, анализ тональности русского текста работает неплохо. я не очень понимаю идею - это должно выглядеть как гугл трендс? или что перевешивает сейчас по конкретному запросу - плохо или хорошо? включая анализ комментариев под новостями?

KlonD90 added the idea label Dec 2, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Идея: анализ упоминаний и тематик в СМИ #25

Идея: анализ упоминаний и тематик в СМИ #25

dractw commented Dec 2, 2019 •

edited

Loading

dractw commented Dec 2, 2019

aurman21 commented Dec 4, 2019

dractw commented Dec 5, 2019 •

edited

Loading

sasha110110 commented Dec 6, 2019

Идея: анализ упоминаний и тематик в СМИ #25

Идея: анализ упоминаний и тематик в СМИ #25

Comments

dractw commented Dec 2, 2019 • edited Loading

dractw commented Dec 2, 2019

aurman21 commented Dec 4, 2019

dractw commented Dec 5, 2019 • edited Loading

sasha110110 commented Dec 6, 2019

dractw commented Dec 2, 2019 •

edited

Loading

dractw commented Dec 5, 2019 •

edited

Loading