Пакет Sentimentr с французским словарем

Я создал словари полярности и сдвига (несколько слов просто для проверки) со столбцами x и y по запросу.

Я получаю следующую ошибку:

Ошибка в [.data.frame`(polarity_dt, word_dat[["words"]]): выбраны неопределенные столбцы

Пожалуйста, не могли бы вы помочь мне? Заранее спасибо.

С наилучшими пожеланиями

FEEL_polarity <- read.csv2('./FEEL_polarity.csv')
SHIFTERS <- read.csv2('./Shifters.csv')

library("sentimentr")

text_to_analyse <- c("Je ne suis pas heureux. Je suis heureux.")

sentiment(get_sentences(text_to_analyse), polarity_dt = FEEL_polarity,valence_shifters_dt = SHIFTERS)

1 ответ

Как вы уже упоминали в комментариях, лучше всего использовать data.table для таблиц полярности и сдвига и установите ключ.

Если я выполню это с вашим текстом, я получу результат ниже. -1.3 для предложения 1 и 1.7 для предложения 2. Помните, что отрицатели следует кодировать как 1L, а не -1L.

library(sentimentr)
library(data.table)

text_to_analyse <- c("Je ne suis pas heureux. Je suis heureux.")

polarity <- data.table(x = "heureux",
                       y = 3L, 
                       key = "x") 


shifters <- data.table(x = "ne",
                       y = 1L,
                       key = "x")


sentiment(get_sentences(text_to_analyse), 
          polarity_dt = polarity,
          valence_shifters_dt = shifters)

   element_id sentence_id word_count sentiment
1:          1           1          5 -1.341641
2:          1           2          3  1.732051

Вы понимаете, что sentimentr разработан для английского языка. Французские словари вы можете посмотреть на следующих сайтах:

FEEL: лексикон расширенной французской эмоции. http://advanse.lirmm.fr/feel.php Французский лексикон, содержащий более 14 000 различных слов, выражающих эмоции и чувства. Он следует за Экманом двумя основными полярностями и шестью эмоциями (Ekman, 1992). Он был создан путем автоматического перевода и расширения английского эмоционального лексикона NRC-Canada (Mohammad & Turney, 2013). Процесс был проверен и подтвержден вручную профессиональным переводчиком.

Этот файл можно настроить, чтобы он работал с sentimentr или может быть с tidytext, Я все еще должен изучить это. И возможно udpipe может быть лучше для французского.

POLTEXT: https://www.poltext.org/en/donnees-et-analyses/lexicoder с лексиконом, который вы можете использовать с quanteda

Другие вопросы по тегам