Описание тега pos-tagging

Пометка части речи (POS tagging или POST) - это процесс разметки слова в текстовом корпусе как соответствующего определенной части речи на основе как его определения, так и его контекста.
2 ответа

Индекс строки вне диапазона в тегах POS

Я делаю POS-теги, используя пакет nltk в Python. Теперь он показывает индекс строки ошибки вне диапазона, хотя моя строка не очень большая. import nltk sample_list = ['', 'emma', 'jane', 'austen', '1816', '', 'volume', 'chapter', 'emma', 'woodhouse'…
29 окт '18 в 13:38
1 ответ

Параметры для расчета точности части речевого тегера

Я новичок в обработке естественного языка, и у меня есть этот базовый вопрос о расчете точности POS Tagger (тегер использует корпус): (Не путайте слово "набор" ниже с математическим определением набора. Я просто использую его как обычное английское …
0 ответов

Результат дерева анализатора OpenNLP

Я использую OpenNLP для синтаксического анализа некоторых медицинских отчетов, но один из результатов дерева парсеров привлекает мое внимание. Исходная строка выглядит следующим образом: "Они заменены опухолевой тканью, которая показывает железистую…
21 июл '17 в 07:04
0 ответов

NLTK MWETokenizer не может извлечь значение тега

Я использую MWETokenizer от NLTK, чтобы получить многословные теги. Вот мой пример кода: import nltk import pickle from nltk.stem.wordnet import WordNetLemmatizer from nltk.tokenize import MWETokenizer # initializing Wordnet Lemmatizer lmtzr = WordN…
21 ноя '18 в 07:06
0 ответов

Python: pos-тег - со словом "назад"

Как отличить тег post от back в следующих предложениях: испытывает периодическую стреляющую боль в нижней части спины после столкновения где-то в затылке Примеры из простора doc = nlp(u'experiencing intermittent shooting pain in her lower back follo…
25 фев '19 в 16:27
0 ответов

Почему POS-теги занимают так много времени? Есть ли способ повысить скорость?

Класс POSTagger(объект): def init (self): проход def pos_tag(self, sentences): """ input format: list of lists of words e.g.: [['this', 'is', 'a', 'sentence'], ['this', 'is', 'another', 'one']] output format: list of lists of tagged tokens. Each tag…
14 май '16 в 06:54
1 ответ

Как вывести NLTK pos_tag в строку вместо списка?

Мне нужно запустить nltk.pos_tag для большого набора данных, и мне нужно, чтобы его вывод был похож на тот, который предлагает Stanford tagger. Например, во время выполнения следующего кода у меня есть; import nltk text=nltk.word_tokenize("We are go…
17 мар '17 в 19:24
1 ответ

Как получить POS-теги сложных слов в Стэнфорде

Я использовал Stanford POS Tagger, чтобы пометить части речи в предложении, я использовал следующий код: private static MaxentTagger tagger = new MaxentTagger(".../english-left3words-distsim.tagger"); String tags= tagger.tagString(st); //st is a str…
08 сен '15 в 12:23
0 ответов

Что означает At.String?

AT.String(0,1) Это метод? Я пытался найти его в Интернете, но ничего не нашел, надеюсь, мне кто-нибудь объяснит. Спасибо.
01 дек '18 в 14:18
2 ответа

Создайте код на Python, чтобы получить наиболее частую пару тегов и значений из списка

У меня есть файл.txt с 3 столбцами: положение слова, слово и тег (NN, VB, JJ и т. Д.). Пример текстового файла: 1 i PRP 2 want VBP 3 to TO 4 go VB Я хочу найти частоту слова и тега как пары в списке, чтобы найти наиболее часто назначаемый тег для сл…
28 сен '18 в 05:51
1 ответ

Найти соответствующие существительные или глаголы прилагательных и наречий в английском предложении

Моя цель - построить алгоритм, который дает прилагательное или наречие в предложении, указывает на соответствующее существительное или глагол. Например: Мальчик сердито бросил тяжелый камень в окно, которое было очень далеко. тяжелый (прил.) -> каме…
01 фев '18 в 21:57
2 ответа

Ошибка кодирования в тегах pos с nltk 3.0 на python 3.4

Я использую NLTK 3.0 с Python 3.4 и не может делать POS-теги из-за следующей ошибки: я прочитал все похожие посты, связанные с похожими проблемами, но не смог найти способ решить эту проблему. большинство постов упоминают, что обновление до NLTK 3.0…
27 окт '14 в 06:41
1 ответ

Не в состоянии правильно пометить предложение хинди

Недавно я начал проект по обработке данных на хинди. Я попытался выполнить определенный ниже код, но не получил ожидаемый результат. e = u"पूर्ण प्रतिबंध हटाओ : इराक" tokens=nltk.word_tokenize(e) from nltk import pos_tag print tokens tag = nltk.pos_ta…
04 мар '15 в 16:08
1 ответ

Facing AttributeError: для tag_, использующего Spacy в Python

Я использую Spacy для "POS Tagging" и получаю ошибку ниже. У меня есть датафрейм, в котором есть столбец "описание", в котором мне нужно извлечь POS для каждого слова Фрейм данных: No. Description 1 My net is not working 2 I will be out for dinner 3…
13 дек '18 в 06:10
0 ответов

Помогает ли POS-тегирование встраиванию ELMo? Также выдается много ложных срабатываний в случае измерения сходства.

Я пытался найти сходство для двух предложений, и мне было интересно, учитывали ли вложения ELMo концепцию тегов POS при создании векторного вывода для предложения. Если нет, если я введу свое предложение с помощью тегов pos(скажем, с помощью SpaCy),…
03 янв '19 в 13:14
6 ответов

spaCy token.tag_ полный список

Официальная документация token.tag_ в spaCy как следует: Мелкозернистый, более подробный тег, представляющий класс слов и некоторую базовую морфологическую информацию для токена. Эти теги в первую очередь предназначены для использования в последующи…
03 июн '16 в 09:46
0 ответов

Как использовать конкретную языковую модель для UDPipe

Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe). Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в src папку, как указано в руководстве по ус…
04 фев '19 в 18:02
1 ответ

NLTK его и ее помечены по-разному,

Я только начал экспериментировать с обработкой естественного языка. Мои первые несколько строк кода с NLTK дали непонятные результаты. import nltk exampleArray = ['The book is hers', 'The book is his'] for item in exampleArray: tokenized = nltk.word…
26 фев '19 в 17:50
1 ответ

Возможная ошибка с Stanford POS Tagger и классификационным намерением и ответами

У меня есть конкретный случай использования, где человек сказал бы что-то вроде этого: "Эй (Слово запуска), заметка в истории объекта XYZ" или: "Привет (Trigger Word), запишите в диагностике объекта, что PQR" ("объект", используемый в примере, являе…
2 ответа

Список терминов / pos-тегирование векторов терминов в R

У меня есть файл.csv только с одним столбцом, содержащим 1000 строк. Каждая строка содержит слово (модель мешка со словами). Теперь я хочу выяснить для каждого слова, является ли оно существительным, глаголом, прилагательным и т. Д. Я хотел бы иметь…
14 май '18 в 14:42