Ошибка в использовании NGramTokenize (проблема lapply)

Я использую NGramTokenizer из пакета rWeka. Я считаю, что все правильно установил. Я выполняю следующий код:

Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer()))

Я получаю сообщение об ошибке:

Error in lapply(x,f): argument "x" is missing with no default.

Любые идеи о том, как решить эту проблему? Еще раз спасибо заранее.

Лучший

Вишал

1 ответ

Решение

Похоже, вы выполняете Bigram_Tokenizer() в функции TermDocumentMatrix вместо того, чтобы просто передавать ее по ссылке. Вам нужно просто передать это без выполнения:

Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer))
Другие вопросы по тегам