Пакет для анализа настроений в Твиттере
Я пытаюсь провести анализ настроений в Твиттере на китайском, французском, норвежском, русском, персидском, иврите, немецком, хинди, индонезийском, японском, корейском, португальском, турецком и арабском языках. Просто хочу спросить, есть ли какие-нибудь пакеты для этих языков и вообще, на каких языках есть пакеты поддержки для анализа настроений в Твиттере? Язык программирования не имеет значения. Спасибо!!!
0 ответов
По моему собственному опыту, лучший способ использовать классификаторы тональности в твиттере - это создать свой собственный набор слов на выбранном вами языке.
Я рекомендую использовать Vader, инструмент Python для анализа лексики, специально разработанный для социальных сетей. Однако Vader доступен только на английском языке. В этом случае вам следует получить списки слов на других языках и перевести их с помощью Google API. Затем вы нанимаете Вейдера.
Подробности можно узнать на этой странице: https://towardsdatascience.com/almost-real-time-twitter-sentiment-analysis-with-tweep-vader-f88ed5b93b1c
Это не самая подходящая процедура. Лучше всего сосредоточиться на одном или двух языках, потому что существуют культурные различия, которые снижают точность алгоритма.
Надеюсь, вы сочтете это полезным. Приветствие.