Описание тега pos-tagger

A part-of-speech tagger, or POS tagger, is a concrete implementation of algorithms which associate discrete terms, as well as hidden parts of speech, in accordance with a set of descriptive tags, such as the identification of words as nouns, verbs, adjectives, adverbs, and so on. It often follows an approach based on Machine Learning (ML) techniques.
1 ответ

Параметры для расчета точности части речевого тегера

Я новичок в обработке естественного языка, и у меня есть этот базовый вопрос о расчете точности POS Tagger (тегер использует корпус): (Не путайте слово "набор" ниже с математическим определением набора. Я просто использую его как обычное английское …
1 ответ

Ошибка в Stanford Pos Tagger

Здравствуйте, я пытаюсь сделать POS-тег для определенного предложения, используя Stanford Pos Tagger. Я использую Python 3.4 nltk 3.1 на Windows7 Ниже приведен код, который я использовал: import nltk from nltk.tag.stanford import POSTagger import os…
27 фев '16 в 22:11
1 ответ

Как извлечь существительные из датафрейма

Я хочу извлечь существительные из датафрейма. Только существительные. Я делаю как ниже import pandas as pd import nltk from nltk.tag import pos_tag from nltk import word_tokenize df = pd.DataFrame({'noun': ['good day', 'good night']}) я хочу получит…
06 сен '16 в 16:04
2 ответа

Не могу заставить POS-тегер Stanford работать в nltk

Я пытаюсь работать со Stanford POS tagger в NLTK. Я использую пример, показанный здесь: http://www.nltk.org/api/nltk.tag.html Я могу загрузить все гладко: >>> import os >>> from nltk.tag import StanfordPOSTagger >>> os.env…
09 янв '16 в 11:38
0 ответов

NLTK MWETokenizer не может извлечь значение тега

Я использую MWETokenizer от NLTK, чтобы получить многословные теги. Вот мой пример кода: import nltk import pickle from nltk.stem.wordnet import WordNetLemmatizer from nltk.tokenize import MWETokenizer # initializing Wordnet Lemmatizer lmtzr = WordN…
21 ноя '18 в 07:06
1 ответ

Парсер тегов для OpenNLP

Есть ли документация о значении тегов парсера в OpenNLP? Я знаю, что типы тегов POS соответствуют соглашению TreeBank, но, к сожалению, я не нашел никакой информации о тегах синтаксического анализатора, таких как "SBAR" и т. Д. Эта документация где-…
10 апр '13 в 16:46
0 ответов

Python: pos-тег - со словом "назад"

Как отличить тег post от back в следующих предложениях: испытывает периодическую стреляющую боль в нижней части спины после столкновения где-то в затылке Примеры из простора doc = nlp(u'experiencing intermittent shooting pain in her lower back follo…
25 фев '19 в 16:27
2 ответа

Python: открыть тег дерева в скрипте

Как я могу использовать treetagger в питон-скрипте? У меня есть предложение, и treetagger должен проанализировать это. В normal В командной строке я могу сделать следующее: echo 'This is a test!' | cmd/tree-tagger-english-utf8 но как я могу сделать …
28 май '14 в 14:59
3 ответа

POS-теги в Scala

Я попытался пометить POS предложение в Scala, используя парсер Стэнфорда, как показано ниже val lp:LexicalizedParser = LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz"); lp.setOptionFlags("-maxLength", "50", "-retai…
24 авг '13 в 08:29
0 ответов

Обучающие данные для UnigramTagger= Brown корпус, данные тестирования = новые предложения, помеченные nltk.pos_tag

Пожалуйста, дайте мне знать, можем ли мы обучить UnigramTagger с коричневым корпусом и оценить тот же UnigramTagger на данных тестирования, которые были помечены с помощью nltk.pos_tag? Если да, как мы можем интерпретировать точность? Код СНиП **dat…
02 дек '16 в 08:00
2 ответа

Корейский, тайский и индонезийский POS-тегер

Кто-то может порекомендовать POS-тег с открытым исходным кодом для корейского, индонезийского, тайского и вьетнамского языков? Это я могу использовать, чтобы пометить данные корпуса, которые у меня есть в настоящее время. (например, Стэнфорд-Постагг…
12 мар '11 в 04:31
1 ответ

NLTK Perceptron Tagger - Что он распознает как FW (иностранное слово)?

Относительно новичок в NLP и работает с тегами предложений, которые содержат иностранные слова, с помощью PerceptronTagger (в Python) NLTK - но он продолжает помечать маркированное иностранное слово позицией в синтаксисе, а не как "FW". Должно ли вс…
14 июн '17 в 17:12
1 ответ

Как рассчитать точность pos tagger по каждому тегу

Я создал pos-тег для модели keras, используя статью NLP4Hackers в качестве основы. В настоящее время я могу вычислить точность непосредственно по методу keras model.evaluate. На самом деле, я хотел бы рассчитать точность по тегу, как показано ниже: …
31 окт '18 в 17:35
1 ответ

Как использовать stanford pos tagger для оригинального текста на китайском языке, только не сегментированного

Привет, ребята: Я могу использовать POS-тег для пометки сегментированного китайского текста, вызывая методMaxentTagger.tokenizeText(Reader r) но теперь я хочу пометить оригинальный китайский текст просто не сегментирован, я знаю методMaxentTagger.to…
16 мар '15 в 12:03
2 ответа

NLTK POS tagger не работает

Если я попробую это: import nltk text = nltk.word_tokenize("And now for something completely different") nltk.pos_tag(text) Выход: Traceback (most recent call last): File "C:/Python27/pos.py", line 3, in <module> nltk.pos_tag(text) File "C:\Py…
24 янв '13 в 17:15
1 ответ

Демонстрация Stanford POStagger не работает в Windows

Я пытаюсь запустить Stanford POSTagger (версия 3.6) с помощью Windows cmd, и у меня возникают проблемы. Я следую инструкциям в README с исправлениями для Windows. У меня есть каталог (C:\Program Files\stanford-postagger-full-2015-12-09>) с файлами P…
22 авг '16 в 17:54
2 ответа

Обучающий тег Brill в nltk, AttributeError: у объекта 'module' нет атрибута 'SymmetricProximateTokensTemplate'

Я тренирую Брилл Таггер против корпуса conll2000. По причинам, которые я не понимаю, у меня возникает следующая ошибка: brill.SymmetricProximateTokensTemplate (brill.ProximateTagsRule, (1,1)), AttributeError: у объекта 'module' нет атрибута 'Symmetr…
25 авг '15 в 20:28
2 ответа

Используя постаггер Stanford в java, получая java.lang.IncompatibleClassChangeError

Я пытаюсь инициализировать Stanford NLP Part of Speech tagger и продолжаю получать java.lang.IncompatibleClassChangeError. Когда я печатаю причину ошибки, я получаю ноль, когда я печатаю сообщение, я получаю Реализующий класс. Это мой код: try { Max…
11 янв '10 в 06:06
2 ответа

Создайте код на Python, чтобы получить наиболее частую пару тегов и значений из списка

У меня есть файл.txt с 3 столбцами: положение слова, слово и тег (NN, VB, JJ и т. Д.). Пример текстового файла: 1 i PRP 2 want VBP 3 to TO 4 go VB Я хочу найти частоту слова и тега как пары в списке, чтобы найти наиболее часто назначаемый тег для сл…
28 сен '18 в 05:51
0 ответов

Обработка естественного языка. POS-теги и синтаксический анализ

В настоящее время я усердно работаю над созданием собственной библиотеки для обработки английского языка. Настоящая задача состоит в том, чтобы пройти через все изобилие теоретического материала и получить представление о том, как поставить все это …
21 июл '17 в 07:28