DocumentTermMatrix() возвращает 0 терминов в пакете tm

У меня есть такой объект:

str(apps)
 chr [1:17517] "35 44 33 40 33 40 44 38 33 37 37" ...

В каждой строке число разделяется пробелом.

corpus<-Corpus(VectorSource(apps))
dtm<-DocumentTermMatrix(corpus)
str(dtm)
List of 6
 $ i       : int(0) 
 $ j       : int(0) 
 $ v       : num(0) 
 $ nrow    : int 17517
 $ ncol    : int 0
 $ dimnames:List of 2
  ..$ Docs : chr [1:17517] "1" "2" "3" "4" ...
  ..$ Terms: NULL
 - attr(*, "class")= chr [1:2] "DocumentTermMatrix" "simple_triplet_matrix"
 - attr(*, "weighting")= chr [1:2] "term frequency" "tf"

Я обнаружил, что условия имеют значение NULL. Я не знаю точно структуру данных для DocumentTermMatrix()Я просто следую за этой темой Document-Term-Matrix TM Package в R. Кто-нибудь может помочь решить это? Спасибо

0 ответов

Другие вопросы по тегам