Описание тега part-of-speech

Лингвистическая категория слов
2 ответа

Python: сопоставление POS-тегов NLTK Stanford с POS-тегами WordNet

Я читаю список предложений и помечаю каждое слово тегом Stanford POS от NLTK. Я получаю вывод, как так: wordnet_sense = [] for o in output: a = st.tag(o) wordnet_sense.append(a) выходы: [[(u'feel', u'VB'), (u'great', u'JJ')], [(u'good', u'JJ')]] Я х…
17 фев '16 в 14:06
0 ответов

Запуск Minipar

Я хотел бы использовать синтаксический анализатор Minipar, модуль POS и особенно анализатор разрешения местоимений (разрешение coreferrence). Я использую Windows 10, и я загрузил версию GATE, содержащую Minipar: GATE_Developer_8.1. Я следовал руково…
03 май '16 в 08:44
1 ответ

NLTK PoS маркировка

Я новичок в Python и мне это нужно для пометки PoS. Поэтому я попытался использовать стандартные инструменты. Я пытался создать тег и получить ошибку ValueError, которую я не понимаю. Мой код: import nltk tagged_sents = nltk.corpus.brown.tagged_sent…
16 мар '16 в 09:05
1 ответ

Спровоцируйте тегер части речи NLTK, чтобы сообщить о собственном существительном множественного числа

Давайте попробуем отреставрированный тегер части речи Python в nltk пакет. import nltk # You might also need to run nltk.download('maxent_treebank_pos_tagger') # even after installing nltk string = 'Buddy Billy went to the moon and came Back with se…
10 июл '15 в 20:34
1 ответ

Python - Как вы используете теги от pos_tag (NLTK)?

Я пытался выяснить, как использовать "помеченные" результаты от части речевого тегирования. В настоящее время у меня есть этот тестовый код: Когда я запускаю его, он возвращается с этим: Это все хорошо. Но я хочу иметь возможность использовать этот …
01 фев '17 в 20:52
0 ответов

Какие теги использует Google NL API в своем аннотированном синтаксическом ответе?

Я использую синтаксический метод аннотации Google NL API и использую Brat для визуализации ответа. Где я могу найти точный список "тегов" или "меток" для слов и отношений зависимостей, которые используются в Google NL API. "partOfSpeech": {"tag": "A…
23 фев '17 в 22:19
0 ответов

Алгоритм анализа настроений совет

Я реализовал простой наивный байесовский классификатор и k-nn для анализа настроений. Я занимаюсь сравнительным изучением алгоритмов анализа настроений. Я хочу реализовать еще один алгоритм анализа настроений. Я изучал модель максимальной максимальн…
0 ответов

WordNet (JWI): как найти слово без части речи?

Я разрабатываю одно образовательное приложение для Android. Мне нужен автономный словарь английского языка для перевода некоторых слов, поэтому я решил использовать базу данных WordNet и их библиотеку Java. В этой библиотеке есть метод поиска по лем…
09 ноя '18 в 11:44
1 ответ

Использование Stanford Dependency Parser в ранее помеченном предложении

В настоящее время я использую тег POS Twitter, доступный здесь, чтобы отмечать твиты в тегах Penn-Tree Bank. Вот этот код: import java.util.List; import cmu.arktweetnlp.Tagger; import cmu.arktweetnlp.Tagger.TaggedToken; /* Tags the tweet text */ Lis…
08 янв '14 в 01:54
1 ответ

Тэг Python NLTK PoS неточный

Я пытался улучшить POS-тегер на NLTK в течение нескольких дней, но я не могу понять это. Прямо сейчас тег по умолчанию действительно неточен и отмечает большинство слов как "NN". Как я могу улучшить тегер, чтобы сделать его более точным? Я уже смотр…
03 фев '17 в 21:14
1 ответ

Почему вставка с пробелом не работает так, как ожидалось?

Мне нужно составить предложения из списка векторов POS. Поэтому я использую paste с sep=' ' Но, похоже, это никак не повлияет на мой результат. Зачем? listPOS <- list(c("/NN", "/PDAT", "/VVFIN", "/VVPP", "./$."), c("/PPER", "/VVFIN", "/APPR", "./…
23 фев '14 в 14:23
1 ответ

Что создало `maxent_treebank_pos_tagger/english.pickle`?

nltk Встроенный в пакет тегер части речи, похоже, не оптимизирован для моего варианта использования ( например, здесь). Исходный код здесь показывает, что он использует сохраненный, предварительно обученный классификатор под названием maxent_treeban…
13 июл '15 в 14:33
0 ответов

Отображение тегов POS Универсальный (CoNLL-U) в WordNet?

Кто-нибудь знает о стандартном протоколе для отображения универсального ( http://universaldependencies.org/u/pos/) или стандартного nltk POS (часть речевых тегов) на wordnet? Я бродил по сети, но не нашел ничего, поэтому подумал, что я просто провер…
05 дек '18 в 15:09
1 ответ

Существует ли комбинированная модель, которая может генерировать теги POS и NER, используя библиотеку НЛП Стэнфорда

Вот пример вывода текста: Добрый день / Полдень NNP / Раджат NNP / ЧЕЛОВЕК Райна / ЧЕЛОВЕК,/O как /WRB вы /VBP вы /PRP сегодня /NN?/O
0 ответов

CoreNLP Часть речевого глагола

Я пытаюсь выполнить pos-теги для общей фразы. Используя этот код, в соответствии с глаголом, мне возвращается только "V", но я также хотел бы получить конкретную информацию о глаголе (например, время, человек и т. Д.). Как я могу получить конкретную…
13 фев '19 в 17:37
0 ответов

Python Pandas NLTK: добавление счетчиков частоты или оценки важности к части фрагментов речи в текстовом столбце Dataframe

Я выполнил NLTK-часть речевого тегирования с последующей разбивкой на один столбец ("train_text") внутри моего фрейма данных Pandas. Ниже приведен мой успешно выполненный код и примеры результатов вывода. def process_content(): try: for i in train_t…
19 дек '18 в 16:41
0 ответов

Откройте POS-теги.txt-файл с тегами в Python

Я пытаюсь пометить несколько интервью на немецком языке. Я получил отличные результаты с ClassifierBasedGermanTagger, используя Tiger-Corpus. Я сохранил отмеченные результаты в виде файлов.txt, но из-за некоторых проблем, касающихся качества транскр…
12 фев '19 в 21:55
2 ответа

Как я могу отключить запись сообщений от Pang-тега Stanford?

У меня есть около 4 миллионов текстов для аннотации с помощью Stanford POS tagger. Как я могу отключить эти сообщения журнала: Reading POS tagger model from edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger ... …
23 авг '15 в 19:39
1 ответ

Поиск строки по сочетанию синтаксических и регулярных выражений

Я хотел бы использовать R для поиска в тексте шаблонов, выраженных через смесь POS и реальных строк. (Я видел эту функциональность в библиотеке Python здесь: http://www.clips.ua.ac.be/pages/pattern-search). Например, шаблон поиска может быть: 'NOUNP…
30 мар '15 в 08:17
1 ответ

Apache OpenNLP Часть речевого тэгера: обучены, какой набор данных?

Я использую Apache OpenNLP Part-of-Speech Tagger для распознавания классов слов в наборе текста. Я пытаюсь оценить теггер на предмет его производительности, и мне было интересно, на каких данных он мог быть обучен? Название моделей, существующих на …
02 май '15 в 06:39