Описание тега ner
Распознавание именованных сущностей (NER) включает извлечение определенных сущностей, таких как люди, организации или места из текста на естественном языке.
0
ответов
Распознавание именованных объектов на фрейме данных Python
Мой фрейм данных Python выглядит примерно так после удаления стоп-слов и токенизации issue_detail 0 [I, outdated, information, credit, report, I, ... 1 [This, company, refuses, provide, verification... 2 [Need, move, XXXX, facility, ., Can, longer, …
24 авг '18 в 00:11
0
ответов
Можно ли получить тег Date из неестественного предложения?
Я хочу получить информацию ДАТА из предложения.Он сочетается только с такими кодами, как "ST JOHN 100H -OPEN TEXAS APR 05/08" То, что мне нужно из предложения, это АПРЕЛЬ 05/08, который является датами. Я запустил свой код, но не повезло.. doc = nlp…
10 июл '18 в 05:07
1
ответ
Сохраняйте модель NER Spacy после каждой итерации
Я пытаюсь сохранить в Spacy пользовательскую модель NER после каждой итерации. Есть ли у нас какие-либо API-интерфейсы, подобные тем, которые есть в tenorflow, для сохранения весов моделей после каждого / определенного нет. итераций. И тогда я могу …
18 янв '18 в 17:17
1
ответ
TypeError: "<" не поддерживается между экземплярами "NoneType" и "str" с использованием Pyner для распознавания сущности имени
Я пытаюсь передать строку электронной почты Pyner, чтобы вытащить все объекты в словарь. Я могу проверить, что моя установка работает с этим возвращением двух лиц ЧЕЛОВЕКА import ner tagger = ner.SocketNER(port=9191, output_format='slashTags') t = "…
04 янв '18 в 12:00
0
ответов
Как использовать Stanford Dcoref для отдельно аннотированного текста
В настоящее время я пытаюсь создать конвейер, в котором я обрабатываю свой текст с помощью Stanford NLP, использую свой собственный тег NER, а затем снова выполняю разрешение ссылок с помощью Stanford, но я не могу найти способ сделать это. Кто-нибу…
24 мар '18 в 08:19
0
ответов
Добавление знаний о домене (пользовательские функции) в NER
Я на машине с Ubuntu с Python 3.5.2 и spaCy 2.0. Я тренирую пустую испанскую модель для распознавания сущностей в резюме. Для этого я использовал пользовательские вложения слов, и я делаю большой проект аннотации сущностей. Мне удалось сегментироват…
10 янв '18 в 13:53
0
ответов
Библиотека Perl Named Entity Recognition для отображения электронных писем и стран телефона
Я ищу библиотеку Perl для извлечения адресов электронной почты и телефонов, сущностей и имен, таких как этот модуль "Lingua::EN::NamedEntity" Кто-нибудь знает о каком-то модуле perl, который может это сделать?
29 апр '18 в 19:27
1
ответ
В spaCy почему '\n' постоянно помечается как GPE английским NER?
Я начинаю знакомиться с spaCy v2.0. Когда я запускаю Lightning_Tour.py со своими собственными документами, я вижу, что строка конца строки \n постоянно выводится как GPE на выходе объекта. Так есть ли какой-либо способ предварительной обработки доку…
22 ноя '17 в 18:00
0
ответов
Как отправить выходные слова из нер или классификатора на вход движка Java
Я использовал NER, чтобы пометить слова как из файла TXT. Я использовал "синий" тег для классификации текста из текстового документа. Я обучил модель на данных TXT со столбцом text = 0 и столбцом answer =1. Возвращаемые слова результата с '0' и 'син…
09 янв '19 в 07:15
0
ответов
Почему я получаю несколько объектов как один
Я использую пользовательскую модель NER (на основе CRF) для тегирования NER. но проблема в том, что в тестовых данных встречаются несколько объектов, разделенных пунктуацией или каким-либо стоп-словом. это целое как одно целое. например-для "Индии, …
15 янв '19 в 12:10
0
ответов
UnicodeDecodeError в компиляции StanfordNERTagger
Я использую оболочку NLTK для тегирования NER с использованием модели Stanford 3class. На новостях BBC необработанный текст, который пишется на английском языке, получает UnicodeDecodeError. Вот мой код from nltk.tag import StanfordNERTagger st1 = S…
29 янв '19 в 15:08
0
ответов
NER: подготовленные данные для обучения
Я хочу попытаться решить задачу NER с данными Conll 2003. Я видел много информации о том, как готовить набор данных для обучения, но все это было по-другому и не было всеобъемлющим. Во-первых, я преобразовываю эти данные в предложения def read_file(…
02 фев '19 в 21:34
0
ответов
Распознавание названия продукта из неформального текста
Около 5 лет назад я переподготовил Stanford NER, и это работает несколько, но новые продукты часто пропускаются. В то время я переучил всю модель NER. То, что я действительно хотел бы сделать, это точно настроить модель NER Стэнфорда. Можно ли это с…
23 июл '18 в 19:29
1
ответ
Как потренировать собственную модель и протестировать ее со вкусом
Я использую приведенный ниже код для обучения уже существующей модели пространства. Тем не менее, я не получаю правильные результаты на тестах: Чего мне не хватает? import spacy import random from spacy.gold import GoldParse from spacy.language impo…
28 фев '19 в 17:11
1
ответ
Как проанализировать NER, обученный с использованием Spacy?
Это простой код, который взят из учебной документации (более или менее). Как только я обучаю модель NER, используя приведенный ниже обучающий код, я использую nlp(sentence).ents внутри цикла for, чтобы получить именованные объекты. Как видите, я исп…
28 янв '19 в 04:05
1
ответ
Stanford NER Tagger и NLTK - не работает [Ошибка OSE: сбой команды Java]
Попытка запустить Stanford NER Taggerand NLTK с ноутбука Юпитера. Я постоянно получаю OSError: Java command failed Я уже пробовал взломать на https://gist.github.com/alvations/e1df0ba227e542955a8a и нить Stanford Parser и NLTK я использую NLTK==3.3 …
31 май '18 в 11:07
1
ответ
Токенизация TEI-подобного текста
Я пытаюсь использовать spaCy для токенизации текстового документа, где именованные объекты обернуты в теги XML. Например, TEI- как <personName>Harry</personName> goes to <orgName>Hogwarts</orgName>, import spacy nlp = spacy.l…
09 апр '18 в 13:02
0
ответов
"отрицательные примеры" для пространственного обучения передаче NER?
Я хочу обучить модель spacy v2 NER на своих собственных ярлыках, для которых я просканировал текст с разных веб-страниц. При сканировании, конечно же, есть много текста, который является просто мусором и не содержит никакой информации, но, к счастью…
18 янв '18 в 18:05
1
ответ
JAPE проверка только для числового ввода
У меня есть приведенный ниже файл JAPE для ANNIE, в котором я пытаюсь убедиться, что названия заведений, которые содержат только числовые символы, не аннотируются. Я пробовал много вариантов ниже, но, похоже, не смог заставить его работать. Phase:Es…
14 янв '18 в 02:42
0
ответов
Ner-теги с помощью nltk перед Pos-тегами
Я должен сделать NER-теги для текста, прежде чем применять POS-теги в Excel, используя nltk в Python. Я написал следующий код для проверки правописания в Python, теперь мне нужно написать еще одну функцию, где NER теги должны быть сделаны на тексте.…
21 фев '18 в 05:23