Ошибка в использовании NGramTokenize (проблема lapply)
Я использую NGramTokenizer из пакета rWeka. Я считаю, что все правильно установил. Я выполняю следующий код:
Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer()))
Я получаю сообщение об ошибке:
Error in lapply(x,f): argument "x" is missing with no default.
Любые идеи о том, как решить эту проблему? Еще раз спасибо заранее.
Лучший
Вишал
1 ответ
Решение
Похоже, вы выполняете Bigram_Tokenizer() в функции TermDocumentMatrix вместо того, чтобы просто передавать ее по ссылке. Вам нужно просто передать это без выполнения:
Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2))
tdm <- TermDocumentMatrix(corpus, control = list(tokenize= Bigram_Tokenizer))