Как вы редактируете функцию в R для обработки строк данных Twitter?

Я пытаюсь использовать инструмент настроения VADER nrguimaraes для R, чтобы получить оценки настроения нескольких твитов. Описание инструмента и его установки описано здесь: https://rdrr.io/github/nrguimaraes/sentimentSetsR/man/getVaderRuleBasedSentiment.html

Однако, когда я пытаюсь обработать более одного элемента, появляется ошибка. Я хотел бы отредактировать функцию, чтобы она могла обрабатывать несколько элементов.

Функция:

function (text, compound = TRUE) 
{
    text <- iconv(text, to = "UTF-8")
    text <- gsub("\\p{So}|\\p{Cn}", "", text, perl = TRUE)
    text <- gsub("\\s+", " ", text)
    if (is.na(text)) {
        return(NA)
    }
    if (text == "" || text == " ") {
        return(NA)
    }
    return(PolarityScores(text, compound))
}

Поэтому, когда я бегу

getVaderRuleBasedSentiment(file$text)

Ошибка выходит как

Warning message:
In if (is.na(text)) { :
  the condition has length > 1 and only the first element will be used

Мне интересно, как я могу редактировать эту функцию, чтобы иметь возможность обрабатывать данные, содержащие несколько строк текста, например, когда вы собираете твиты с помощью Rtweet.

0 ответов

Другие вопросы по тегам