Как вы редактируете функцию в R для обработки строк данных Twitter?
Я пытаюсь использовать инструмент настроения VADER nrguimaraes для R, чтобы получить оценки настроения нескольких твитов. Описание инструмента и его установки описано здесь: https://rdrr.io/github/nrguimaraes/sentimentSetsR/man/getVaderRuleBasedSentiment.html
Однако, когда я пытаюсь обработать более одного элемента, появляется ошибка. Я хотел бы отредактировать функцию, чтобы она могла обрабатывать несколько элементов.
Функция:
function (text, compound = TRUE)
{
text <- iconv(text, to = "UTF-8")
text <- gsub("\\p{So}|\\p{Cn}", "", text, perl = TRUE)
text <- gsub("\\s+", " ", text)
if (is.na(text)) {
return(NA)
}
if (text == "" || text == " ") {
return(NA)
}
return(PolarityScores(text, compound))
}
Поэтому, когда я бегу
getVaderRuleBasedSentiment(file$text)
Ошибка выходит как
Warning message:
In if (is.na(text)) { :
the condition has length > 1 and only the first element will be used
Мне интересно, как я могу редактировать эту функцию, чтобы иметь возможность обрабатывать данные, содержащие несколько строк текста, например, когда вы собираете твиты с помощью Rtweet.