Описание тега korpus

Пакет R для анализа текста
1 ответ

Переход от объекта ТМ к объекту KoRpus и наоборот

У меня проблема при переходе от объекта ТМ к объекту koRpus. Я должен нормализовать корпус с помощью инструментов tm, лемматизировать результаты с помощью koRpus и вернуться к tm, чтобы классифицировать результаты. Чтобы сделать это, мне нужно преоб…
16 фев '17 в 10:07
2 ответа

Использование функции дерева тегов koRpus с R

Поскольку я начинаю пробовать корпус для работы с R, любой совет будет отличным. Я установил TreeTagger на мой компьютер с Windows, затем я установил пакет koRpus. Мой вопрос, как я могу использовать treetagger, используя koRpus с R? Есть ли настрой…
08 мар '17 в 09:30
0 ответов

Замена строки на тэге koRpus

Функция tokenize("C:\\test_treetag.txt", clean.raw=list("aren't"="are not")) позволяет мне токенизировать и заменить "не" на токены "не" Я пытаюсь сделать то же самое в функции в функции treetag.
29 июн '16 в 20:26
0 ответов

R koRpus создание векторного объекта, который уже содержит текстовый корпус

Я пытаюсь использовать пакет koRpus в R. Чтобы использовать аргумент tokenize(), мне нужно иметь векторный объект, уже содержащий текстовый корпус. В настоящее время у меня есть только текст в виде столбца во фрейме данных. Текст связан с определенн…
18 май '18 в 17:29
1 ответ

Древовидный пакет koRpus R

Во-первых, я извиняюсь за мой английский, я очень плохо говорю по-английски. Итак, у меня есть вопрос о функции метки дерева из пакета koRpus на R. Я хочу лемматизировать текст, и это нормально для меня с Treetagger. Я использовал функцию treetag: t…
15 мар '17 в 14:26
1 ответ

treetager - Linux - ошибка: указанный файл не может быть найден:

Привет, я работаю в Treetager для извлечения существительных из данных, однако я получаю сообщение об ошибке ниже. Вот мой R скрипт A <- Data_raw$SourceText[10:15] A ## [1] "Hi ... they ... they rather do very helpful and I like your ... have to …
01 мар '16 в 10:49
3 ответа

Компиляция и анализ Корпуса с помощью R и koRpus

Я изучаю литературу, потерянную в науках о данных. Я пытаюсь проанализировать корпус из 70 .txt-файлов, которые все находятся в одном каталоге. Моя конечная цель - получить таблицу, содержащую имя файла (или что-то подобное), количество предложений …
24 июл '17 в 14:37
1 ответ

Рассчитать оценки читабельности для нескольких файлов с R

Я хотел бы рассчитать оценки читабельности в R-3.3.2(R-Studio 3.4 для Win), используя пакет koRpus для нескольких файлов txt.files, и сохранить результаты в excel, sqllite3 или txt. Теперь я могу рассчитать оценку читабельности только для одного фай…
29 ноя '16 в 14:23
1 ответ

Ошибка пакета дерева тегов koRpus

Я пытаюсь использовать функцию Treetag в пакете koRpus. Код, который я использовал tagged.text <-treetag("C:/Rec_By_Others.txt",treetagger="manual",lang="en",TT.options=list(path="C:\\Program Files\\TreeTagger", preset="en")) Но я продолжаю сталк…
28 мар '16 в 07:24
0 ответов

Пакет koRpus, использующий TreeTagger в R (RStudio) на macOS

Я исследую пакет koRpus в R на macOS, пытаясь использовать функцию treetag для следующего объекта: текст [1] "Потому что я не мог остановиться ради Смерти…" "Он любезно остановился ради меня…" [3] "Перевозка держалась, но только мы сами" - "и бессме…
05 ноя '17 в 19:28
0 ответов

Предупреждения при создании словаря лемм с использованием treetagger в R

При использовании функции make_lemma_dictionary появилось предупреждение. Когда я пытался запустить функцию "make_lemma_dictionary", он просто вызвал два предупреждающих сообщения, которые показаны ниже: Предупреждающие сообщения: 1: не могу найти ф…
31 июл '19 в 04:55
0 ответов

проблемы с чтением файлов Word в R с помощью readtext

Простите, если это элементарная проблема. Я пытаюсь использовать такие пакеты, как "readtext" и "koRpus", впервые для этого моего проекта, и мне трудно заставить R читать текстовые файлы, которые я хочу, чтобы он прочитал, поэтому я могу сделать нес…
24 авг '20 в 20:43
0 ответов

Ошибка: не удалось загрузить пакет koRpus

Когда я загружал библиотеку (texttem), было сообщение об ошибке: Loading required package: koRpus.lang.en Loading required package: koRpus Loading required package: sylly Registered S3 method overwritten by 'data.table': method from print.data.table…
04 апр '20 в 20:52
1 ответ

получение R для распознавания файла, полного файлов Word, для анализа koRpus

Мне нужна помощь с загрузкой данных текстового файла в R для анализа с помощью таких пакетов, как koRpus. Проблема, с которой я столкнулся, заключается в том, чтобы заставить R распознавать папку, полную файлов Word (около 4000) как данные, которые …
02 ноя '20 в 20:32
0 ответов

POS и словесные ассоциации tm

Я новичок в использовании пакета tm в R. Я использую функцию findAssocs для получения ассоциаций между словами в моем Корпусе, но я бы хотел запустить ее только среди существительных и прилагательных. Вы знаете, как сделать POS-теги в TM? Я пробовал…
03 окт '20 в 00:34
0 ответов

Загрузка файлов Word в R для анализа читабельности

Со времени моего последнего вопроса я добился значительного прогресса. Я пытаюсь выполнить анализ читабельности в R с помощью koRpus в папке из ~4200 файлов Word. У меня есть два способа сделать это. Я опишу более простой и свои проблемы с ним. Моя …
12 ноя '20 в 21:08
0 ответов

koRPus — команда tokenize для большой папки с текстовыми файлами

Я добился определенного прогресса в том, чтобы заставить koRpus анализировать мои данные, но есть нерешенные проблемы. Команда «tokenize», похоже, работает. Я запускаю следующую строку кода: word <- tokenize("/Users/gdballingrud/Desktop/WPSCASES …
07 фев '22 в 22:21
0 ответов

TreeTagger в R: ошибка, неожиданное '=' в TT.options=, что делать?

Я успешно установил Treetagger на свой Mac и пытался использовать код из учебника, чтобы применить его к предварительно сохраненному тексту в R. Я установил все необходимые пакеты и загрузил их в библиотеку (например, koRPus). Сообщение об ошибке, к…
10 фев '21 в 17:03
0 ответов

Как я могу получить список предложений из корпуса с помощью R (и, возможно, пакета koRpus)?

Я новичок в R и пытаюсь использовать его функции для анализа корпуса в португальских текстах. Я использую пакет koRPus. Я пишу приложение Shiny, которое показывает все предложения, в которых встречается искомое слово. Для этого мне нужно составить с…
09 фев '22 в 14:50
0 ответов

Ошибки в команде tokenize для загрузки файлов Word для анализа удобочитаемости

У меня есть вопрос о пакетах и ​​коде для анализа текста. Общая идея заключается в том, что я пытаюсь выполнить анализ читабельности коллекции из примерно 4000 файлов Word. Я хотел бы провести любой из таких анализов, но теперь проблема заключается …
30 дек '20 в 00:31