Пакет для анализа настроений в Твиттере

Я пытаюсь провести анализ настроений в Твиттере на китайском, французском, норвежском, русском, персидском, иврите, немецком, хинди, индонезийском, японском, корейском, португальском, турецком и арабском языках. Просто хочу спросить, есть ли какие-нибудь пакеты для этих языков и вообще, на каких языках есть пакеты поддержки для анализа настроений в Твиттере? Язык программирования не имеет значения. Спасибо!!!

0 ответов

По моему собственному опыту, лучший способ использовать классификаторы тональности в твиттере - это создать свой собственный набор слов на выбранном вами языке.

Я рекомендую использовать Vader, инструмент Python для анализа лексики, специально разработанный для социальных сетей. Однако Vader доступен только на английском языке. В этом случае вам следует получить списки слов на других языках и перевести их с помощью Google API. Затем вы нанимаете Вейдера.

Подробности можно узнать на этой странице: https://towardsdatascience.com/almost-real-time-twitter-sentiment-analysis-with-tweep-vader-f88ed5b93b1c

Это не самая подходящая процедура. Лучше всего сосредоточиться на одном или двух языках, потому что существуют культурные различия, которые снижают точность алгоритма.

Надеюсь, вы сочтете это полезным. Приветствие.

Другие вопросы по тегам