Описание тега pos-tagging
Пометка части речи (POS tagging или POST) - это процесс разметки слова в текстовом корпусе как соответствующего определенной части речи на основе как его определения, так и его контекста.
2
ответа
Индекс строки вне диапазона в тегах POS
Я делаю POS-теги, используя пакет nltk в Python. Теперь он показывает индекс строки ошибки вне диапазона, хотя моя строка не очень большая. import nltk sample_list = ['', 'emma', 'jane', 'austen', '1816', '', 'volume', 'chapter', 'emma', 'woodhouse'…
29 окт '18 в 13:38
1
ответ
Параметры для расчета точности части речевого тегера
Я новичок в обработке естественного языка, и у меня есть этот базовый вопрос о расчете точности POS Tagger (тегер использует корпус): (Не путайте слово "набор" ниже с математическим определением набора. Я просто использую его как обычное английское …
03 авг '14 в 00:29
0
ответов
Результат дерева анализатора OpenNLP
Я использую OpenNLP для синтаксического анализа некоторых медицинских отчетов, но один из результатов дерева парсеров привлекает мое внимание. Исходная строка выглядит следующим образом: "Они заменены опухолевой тканью, которая показывает железистую…
21 июл '17 в 07:04
0
ответов
NLTK MWETokenizer не может извлечь значение тега
Я использую MWETokenizer от NLTK, чтобы получить многословные теги. Вот мой пример кода: import nltk import pickle from nltk.stem.wordnet import WordNetLemmatizer from nltk.tokenize import MWETokenizer # initializing Wordnet Lemmatizer lmtzr = WordN…
21 ноя '18 в 07:06
0
ответов
Python: pos-тег - со словом "назад"
Как отличить тег post от back в следующих предложениях: испытывает периодическую стреляющую боль в нижней части спины после столкновения где-то в затылке Примеры из простора doc = nlp(u'experiencing intermittent shooting pain in her lower back follo…
25 фев '19 в 16:27
0
ответов
Почему POS-теги занимают так много времени? Есть ли способ повысить скорость?
Класс POSTagger(объект): def init (self): проход def pos_tag(self, sentences): """ input format: list of lists of words e.g.: [['this', 'is', 'a', 'sentence'], ['this', 'is', 'another', 'one']] output format: list of lists of tagged tokens. Each tag…
14 май '16 в 06:54
1
ответ
Как вывести NLTK pos_tag в строку вместо списка?
Мне нужно запустить nltk.pos_tag для большого набора данных, и мне нужно, чтобы его вывод был похож на тот, который предлагает Stanford tagger. Например, во время выполнения следующего кода у меня есть; import nltk text=nltk.word_tokenize("We are go…
17 мар '17 в 19:24
1
ответ
Как получить POS-теги сложных слов в Стэнфорде
Я использовал Stanford POS Tagger, чтобы пометить части речи в предложении, я использовал следующий код: private static MaxentTagger tagger = new MaxentTagger(".../english-left3words-distsim.tagger"); String tags= tagger.tagString(st); //st is a str…
08 сен '15 в 12:23
0
ответов
Что означает At.String?
AT.String(0,1) Это метод? Я пытался найти его в Интернете, но ничего не нашел, надеюсь, мне кто-нибудь объяснит. Спасибо.
01 дек '18 в 14:18
2
ответа
Создайте код на Python, чтобы получить наиболее частую пару тегов и значений из списка
У меня есть файл.txt с 3 столбцами: положение слова, слово и тег (NN, VB, JJ и т. Д.). Пример текстового файла: 1 i PRP 2 want VBP 3 to TO 4 go VB Я хочу найти частоту слова и тега как пары в списке, чтобы найти наиболее часто назначаемый тег для сл…
28 сен '18 в 05:51
1
ответ
Найти соответствующие существительные или глаголы прилагательных и наречий в английском предложении
Моя цель - построить алгоритм, который дает прилагательное или наречие в предложении, указывает на соответствующее существительное или глагол. Например: Мальчик сердито бросил тяжелый камень в окно, которое было очень далеко. тяжелый (прил.) -> каме…
01 фев '18 в 21:57
2
ответа
Ошибка кодирования в тегах pos с nltk 3.0 на python 3.4
Я использую NLTK 3.0 с Python 3.4 и не может делать POS-теги из-за следующей ошибки: я прочитал все похожие посты, связанные с похожими проблемами, но не смог найти способ решить эту проблему. большинство постов упоминают, что обновление до NLTK 3.0…
27 окт '14 в 06:41
1
ответ
Не в состоянии правильно пометить предложение хинди
Недавно я начал проект по обработке данных на хинди. Я попытался выполнить определенный ниже код, но не получил ожидаемый результат. e = u"पूर्ण प्रतिबंध हटाओ : इराक" tokens=nltk.word_tokenize(e) from nltk import pos_tag print tokens tag = nltk.pos_ta…
04 мар '15 в 16:08
1
ответ
Facing AttributeError: для tag_, использующего Spacy в Python
Я использую Spacy для "POS Tagging" и получаю ошибку ниже. У меня есть датафрейм, в котором есть столбец "описание", в котором мне нужно извлечь POS для каждого слова Фрейм данных: No. Description 1 My net is not working 2 I will be out for dinner 3…
13 дек '18 в 06:10
0
ответов
Помогает ли POS-тегирование встраиванию ELMo? Также выдается много ложных срабатываний в случае измерения сходства.
Я пытался найти сходство для двух предложений, и мне было интересно, учитывали ли вложения ELMo концепцию тегов POS при создании векторного вывода для предложения. Если нет, если я введу свое предложение с помощью тегов pos(скажем, с помощью SpaCy),…
03 янв '19 в 13:14
6
ответов
spaCy token.tag_ полный список
Официальная документация token.tag_ в spaCy как следует: Мелкозернистый, более подробный тег, представляющий класс слов и некоторую базовую морфологическую информацию для токена. Эти теги в первую очередь предназначены для использования в последующи…
03 июн '16 в 09:46
0
ответов
Как использовать конкретную языковую модель для UDPipe
Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe ( http://ufal.mff.cuni.cz/udpipe). Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в src папку, как указано в руководстве по ус…
04 фев '19 в 18:02
1
ответ
NLTK его и ее помечены по-разному,
Я только начал экспериментировать с обработкой естественного языка. Мои первые несколько строк кода с NLTK дали непонятные результаты. import nltk exampleArray = ['The book is hers', 'The book is his'] for item in exampleArray: tokenized = nltk.word…
26 фев '19 в 17:50
1
ответ
Возможная ошибка с Stanford POS Tagger и классификационным намерением и ответами
У меня есть конкретный случай использования, где человек сказал бы что-то вроде этого: "Эй (Слово запуска), заметка в истории объекта XYZ" или: "Привет (Trigger Word), запишите в диагностике объекта, что PQR" ("объект", используемый в примере, являе…
12 дек '18 в 15:24
2
ответа
Список терминов / pos-тегирование векторов терминов в R
У меня есть файл.csv только с одним столбцом, содержащим 1000 строк. Каждая строка содержит слово (модель мешка со словами). Теперь я хочу выяснить для каждого слова, является ли оно существительным, глаголом, прилагательным и т. Д. Я хотел бы иметь…
14 май '18 в 14:42