Описание тега treetagger

TreeTagger - это инструмент для аннотирования текста с помощью части речи и информации леммы.
0 ответов

Tree Tagger для Java (tt4j)

Я создаю инструмент анализа настроений в Twitter на Java. Я использую API Twitter4J для поиска твитов с помощью функции хэштега в твиттере, а затем предоставляю анализ настроений в этих твитах. В ходе исследований я обнаружил, что лучшим решением дл…
1 ответ

Пакет TreeTagger недоступен (для версии R 3.3.2)

Я пытаюсь установить пакет TreeTagger, но это невозможно для этой версии R. Я получаю это сообщение об ошибке: > install.packages("TreeTagger", repos = "https://cran.rstudio.com") Installing package into ‘C:/Users/A579856/Documents/R/win-library/…
10 фев '17 в 11:07
0 ответов

Извлекая лемму из каждого предложения в моем списке предложений, а затем используйте его для вычисления оценки настроения каждого предложения

Это мой сценарий: 1) я открываю файл и читаю его; 2) разбить текст на предложения; 3) лемматизировать предложение; 4) для каждого предложения лемматизации извлекаю лемму и помещаю ее в новый список; 5) Я ищу в лексиконе, чтобы найти слово в моем лек…
27 янв '19 в 23:32
2 ответа

Ошибка: произошла ошибка при установке с помощью homebrew?

Я хотел бы установить treetagger в OS X. Чтобы упростить его, я попытался найти, если это возможно с Homebrew. Поэтому я посмотрел в Интернете и нашел эту формулу от пользователя pepijnkokke. Далее я попытался установить treetagger следующим образом…
03 апр '16 в 20:16
1 ответ

Лемма существительного по-французски

Когда я запускаю следующий код, я получаю лемму существительного "Подавление", являющегося тем же словом "Подавление". import treetaggerwrapper as tt tt_fr = tt.TreeTagger(TAGLANG='fr') tag = tt_fr.TagText(u'Suppression') Результат, которого я ждал,…
25 апр '18 в 15:06
0 ответов

Указание пола в pos-тегах, Python

Я пытаюсь Pos-Tag французские предложения с TreeTagger Wrapper, но это не указывает на род существительных Это пример: import treetaggerwrapper import pprint tagger = treetaggerwrapper.TreeTagger(TAGLANG='fr') var1 = 'un garçon' var2 = 'une fille' v…
02 янв '18 в 18:17
2 ответа

R совокупный токен по лемме в пакете тм

Я загружаю и очищаю корпус в R с помощью: myTxt <- Corpus(DirSource("."), readerControl = list(language="lat")) corp <- tm_map(myTxt, removeWords, c(stopwords("french"))) corp <- tm_map(corp, content_transformer(tolower)) corp <- tm_map(…
13 ноя '15 в 11:10
0 ответов

Замена строки на тэге koRpus

Функция tokenize("C:\\test_treetag.txt", clean.raw=list("aren't"="are not")) позволяет мне токенизировать и заменить "не" на токены "не" Я пытаюсь сделать то же самое в функции в функции treetag.
29 июн '16 в 20:26
1 ответ

Как TreeTagger получает лемму слова?

Я использую TreeTagger, чтобы получить леммы слов на испанском, но я заметил, что слишком много слов не преобразованы, как должно быть. Я хотел бы знать, как работает эта операция, если она выполняется с помощью таких методов, как деревья решений ил…
05 июн '18 в 11:04
3 ответа

Разделение с помощью Python-Treetaggerwrapper

Treetagger может делать POS-теги, а также фрагменты текста, что означает извлечение словесных и именных предложений, как в этом немецком примере: $ echo 'Das ist ein Test.' | cmd/tagger-chunker-german reading parameters ... tagging ... finished. &lt…
02 май '16 в 20:23
0 ответов

Treetagger Schmidt неправильный тест

Привет, я должен был правильно установить метку дерева Шмидта, выполнив следующие действия: http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/ К сожалению, когда я пробую тестовую часть, я получаю эту ошибку: echo 'Hello world!' | cmd/tree-tag…
15 авг '18 в 12:05
1 ответ

Пакет: как запустить программу для всех файлов в папке и как создать выходной файл для результата, используя оригинальное имя файла?

Я новичок в пакетном программировании, так что извините за простой вопрос. У меня есть папка с именем FSC в C: \ TTG \ FSC, с тысячами и тысячами текстовых файлов, называемых 1_A.txt 2_A.txt и т. Д. Я хотел бы запустить программу и получить ее вывод…
1 ответ

Древовидный пакет koRpus R

Во-первых, я извиняюсь за мой английский, я очень плохо говорю по-английски. Итак, у меня есть вопрос о функции метки дерева из пакета koRpus на R. Я хочу лемматизировать текст, и это нормально для меня с Treetagger. Я использовал функцию treetag: t…
15 мар '17 в 14:26
1 ответ

Bash: извлечение ячеек из выходных данных в формате таблицы

Я использую TreeTagger ( http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/), чтобы извлечь существительные из текста. Моя проблема в том, что выходные данные отформатированы так: word pos lemma The DT the TreeTagger NP TreeTagger is VBZ be ea…
07 фев '17 в 15:29
0 ответов

Можно ли использовать Java ProcessBuilder с виртуальными файлами?

В настоящее время я работаю над интеграцией Heideltime, в настоящее время автономного приложения, в веб-приложение, которое развертывается с помощью Wildfly. Я переписал большую часть кода, чтобы использовать JBoss VFS вместо обычных файлов, но я за…
28 сен '15 в 14:24
1 ответ

Нужно ли использовать * Unicode* строку в качестве текста для тега, в то время как тегирование с TreeTagger?

С сайта TreeTagger я создал каталог и скачал указанные файлы. Затем treetaggerwrapper, поэтому из документации я попытался протестировать и попытаться пометить некоторый текст следующим образом: In [40]: import treetaggerwrapper tagger = treetaggerw…
17 апр '16 в 17:58
1 ответ

Об использовании Lingua-TreeTagger-0.06

Я очень, очень новичок в НЛП и тому подобное. Поэтому у меня очень простой вопрос. Я хочу пометить POS-тегами набор файлов с помощью TreeTagger, используя Mac OSX 10.6.8, Я установил TreeTagger используя инструкции, представленные на http://www.cis.…
16 фев '15 в 00:27
1 ответ

Часть речи без Python

Я пытаюсь сделать пометки французского текста, но TreeTagger потребности Python который невозможно установить на мой компьютер на работе. Из соображений безопасности невозможно установить другие программы (только R). Можно ли использовать R код для …
10 фев '17 в 13:48
1 ответ

"Поиск" вызывает "Строковый индекс вне диапазона"? (Python)

Я пытаюсь идентифицировать все экземпляры определенного синтаксического шаблона, найденного в тексте: RB + NN|NNS|NP|PP. То есть я ищу наречия, за которыми сразу следуют существительные. Я пометил свой текст с помощью TreeTagger. Текст с тегами хран…
24 май '16 в 13:16
1 ответ

org.annolab.tt4j - Поиск учебника по кусочкам

Я пытаюсь понять, как использовать TreeTagger http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/ обернутый tt4j http://reckart.github.io/tt4j/ разделить текст на части Я не могу найти учебник. Спасибо за помощь
28 ноя '11 в 11:23