Пакет koRpus, использующий TreeTagger в R (RStudio) на macOS
Я исследую пакет koRpus в R на macOS, пытаясь использовать функцию treetag для следующего объекта:
текст [1] "Потому что я не мог остановиться ради Смерти…" "Он любезно остановился ради меня…"
[3] "Перевозка держалась, но только мы сами" - "и бессмертие"
используя следующий синтаксис
> tagged.text <- treetag(as.vector(paste(text, collapse = '')), format = "obj", debug = TRUE)
я получаю следующую ошибку
file: /var/folders/bt/sdf_vz6d3qbd188c7tkz50gw0000gn/T//RtmpoatWov/tempTextFromObject12d3d169614b6.txt sys.tt.call: /Applications/treetagger/cmd/tree-tagger-english /var/folders/bt/sdf_vz6d3qbd188c7tkz50gw0000gn/T//RtmpoatWov/tempTextFromObject12d3d169614b6.txt
Ошибка в матрице (unlist (strsplit (tagged.text, "\ t")), ncol = 3, byrow = TRUE,: "данные" должны быть векторного типа, было "NULL"
когда я пробую смелую команду выше на ее эквиваленте, я получаю это
matrix(unlist(strsplit(paste(text, collapse = ''), "\t"))) [,1] [1,] "Потому что я не мог остановиться из-за Смерти. Он любезно остановился для меня. только мы сами - и бессмертие
мое рабочее пространство выглядит следующим образом
sessionInfo() R версия 3.4.2 (2017-09-28) Платформа: x86_64-apple-darwin15.6.0 (64-разрядная версия) Работает под: macOS High Sierra 10.13.1
Продукты матрицы: по умолчанию BLAS: /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK: /Library/Frameworks/R.framework/Versions/3.4/Rources/lib/libRlapack.dylib
языковой стандарт: [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
прикрепленные базовые пакеты: [1] stats graphics grDevices utils
база методов наборов данныхдругие прикрепленные пакеты: [1] quanteda_0.99.12 koRpus_0.10-2
data.table_1.10.4-3 scale_0.5.0 [5] purrr_0.2.4
readr_1.1.1 tidyr_0.7.2 tibble_1.3.4 [9] tidyverse_1.1.1 gutenbergr_0.1.3 ggplot2_2.2.1
stringr_1.2.0 [13] dplyr_0.7.4 janeaustenr_0.1.5
tidytext_0.1.4загружается через пространство имен (и не присоединяется): [1] reshape2_1.4.2
haven_1.1.0 lattice_0.20-35 colorspace_1.3-2 [5] htmltools_0.3.6 SnowballC_0.5.1 yaml_2.1.14
rlang_0.1.2 [9] foreign_0.8-69 glue_1.2.0
modelr_0.1.1 readxl_1.0.0 [13] bindrcpp_0.2
bindr_0.1 plyr_1.8.4 munsell_0.4.3 [17] gtable_0.2.0 cellranger_1.1.0 rvest_0.3.2
psych_1.7.8 [21] оценивать_0.10.1 knitr_1.17
forcats_0.2.0 parallel_3.4.2 [25] метла_0.4.2
tokenizers_0.1.4 Rcpp_0.12.13 backports_1.1.1 [29] RcppParallel_4.3.20 jsonlite_1.5 fastmatch_1.1-0
mnormt_1.5-5 [33] hms_0.3 digest_0.6.12
stringi_1.1.5 bookdown_0.5 [37] grid_3.4.2
rprojroot_1.2 tools_3.4.2 magrittr_1.5 [41] lazyeval_0.2.1 pkgconfig_2.0.1 Matrix_1.2-11 xml2_1.1.1 [45] lubridate_1.7.1 assertthat_0.2.0 rmarkdown_1.6
httr_1.3.1 [49] R6_2.2.2 nlme_3.1-131
compiler_3.4.2