Описание тега named-entity-extraction
5
ответов
Как мне сделать Entity Extraction в Lucene
Я пытаюсь сделать Entity Extraction (больше похоже на сопоставление) в Lucene. Вот пример рабочего процесса: Учитывая некоторый текст (из URL) И список имен людей, попробуйте извлечь имена людей из текста. Замечания: Имена людей не полностью нормали…
29 ноя '10 в 21:09
0
ответов
Стэнфордский NER готов в localhost, как перенести его на живой сервер?
Я довольно новичок в Java. Я написал свой скрипт NER с php, как показано ниже: require './src/StanfordNLP/Base.php'; require './src/StanfordNLP/Exception.php'; require './src/StanfordNLP/Parser.php'; require './src/StanfordNLP/StanfordTagger.php'; r…
05 окт '15 в 06:23
0
ответов
UnicodeDecodeError в компиляции StanfordNERTagger
Я использую оболочку NLTK для тегирования NER с использованием модели Stanford 3class. На новостях BBC необработанный текст, который пишется на английском языке, получает UnicodeDecodeError. Вот мой код from nltk.tag import StanfordNERTagger st1 = S…
29 янв '19 в 15:08
0
ответов
Как выполнить связывание сущностей с графом локальных знаний?
Я создаю свою собственную базу знаний с нуля, используя статьи онлайн. Я пытаюсь сопоставить сущности из моих очищенных троек SPO (Предмет и, возможно, Объект) с моей собственной записью сущностей, которые состоят из перечисленных компаний, которые …
27 авг '18 в 20:14
1
ответ
Keras LSTM, ожидается 3, но получил массив с формой []
Я пытаюсь найти ярлык, связанный со словом из аннотированного текста. Я использую bidirectional LSTM, я имею X_train которая имеет форму (1676, 39) и Y_train с той же формы (1676, 39). input = Input(shape=(sequence_length,)) model = Embedding(input_…
21 сен '18 в 11:43
1
ответ
Как использовать Wikipedia API для расширения сущностей?
Я работаю над диссертацией, и я столкнулся с проблемой, которую я не знаю, чтобы подходить правильно. Я собираю твиты и, учитывая немногочисленную информацию, которую они несут, я хочу расширить сущности, которые я нахожу в тексте, посещая Википедию…
04 авг '15 в 17:51
0
ответов
НЛП извлекает категорию из текста, используя Java
Как классифицировать слова, извлеченные из текста (используя NLP/NLTK или Textblob), в сущности и категории (из списков или таксономии)? У меня будет база данных ключевых слов, и я хотел бы извлечь строку за строкой из текста соответствующее ключево…
23 май '16 в 18:00
1
ответ
Адаптируете StanfordCoreNLP для обработки шумного веб-текста?
Я пробовал NER StanfordCoreNLP и все вручную на веб-сайте, и, кажется, они зависят от очень специфических / правильных подсказок английского языка, например, для обнаружения объектов. При работе с веб-текстом, где вы могли бы иметь такой текст, как …
06 дек '13 в 02:43
0
ответов
Как извлечь именованный объект из арабского текстового файла с помощью Java
Я хочу извлечь арабские именованные сущности из текстового файла с помощью Java, а затем классифицировать их по классам, таким как (Person, Location, Organization...).
10 окт '18 в 10:52
1
ответ
Как найти список тем wikidata (или freebase или DBpedia), о которых идет речь?
Я ищу решение для извлечения списка концепций, о которых текстовый (или HTML) документ. Я хотел бы, чтобы концепции были темами Викиданных (или freebase или DBpedia). Например, "Плохая песня Микаэля Джексона" должна вернуть Майкла Джексона (исполнит…
08 ноя '16 в 16:59
4
ответа
Веб-сервисы для извлечения сущностей
Существуют ли какие-либо платные или бесплатные веб-службы распознавания именованных лиц? В основном я ищу что-то, где, если я передаю текст, как: "У Джона была картошка фри в Burger King" Это должно быть идентифицировано - что-то вроде: Человек: Дж…
21 май '10 в 01:55
0
ответов
Как я могу извлечь объекты из запроса в Java?
Я нашел Pingar и Энни, но ни один из них не помог мне при отправке запросов. Кажется, что им нужен целый документ для извлечения сущностей, когда я удаляю определенное количество слов, он перестает обнаруживать местоположения и людей и классифицируе…
29 май '12 в 09:09
1
ответ
Как извлечь сущности из HTML, используя обработку естественного языка или другую технику
Я пытаюсь разобрать сущности с веб-страниц, которые содержат время, место и имя. Я немного читал об обработке естественного языка и извлечении сущностей, но я не уверен, что иду по неверному пути, поэтому я спрашиваю здесь. Я еще ничего не начал реа…
21 ноя '13 в 17:55
0
ответов
Используйте Stanford Named Entity Recognizer (NER) с некоторым сопоставлением грамматических выражений
В моих документах все предложения построены с этим конкретным грамматическим выражением:A: человек B: место C: работа.Если я хочу извлечь именованные объекты (Том: ЧЕЛОВЕК), как это сделать?Я использовал Stanford Named Entity Recognizer, но я не мог…
08 май '15 в 07:01
1
ответ
Какие типы сущностей для NLTK?
Я пытался найти полный список типов сущностей NLTK. Мне удалось найти только самые распространенные из них на этой странице, но не полный список. Не могли бы вы поделиться полным списком именованных типов сущностей, которые есть в NLTK?
20 июл '17 в 09:37
1
ответ
Stanford Named Entity Tagger - Несоответствие?
У меня странная проблема. У меня есть список предложений (около 0,1 миллиона), которые нужно пометить с помощью тега Стэнфордского именованного распознавания сущности (ner). Я использовал теги, используя следующую строку кода, предоставленную на дем…
31 июл '14 в 02:43
1
ответ
Параметр begin_offset имеет значение -1 Google NATURAL LANGUAGE API (entity_extraction)
Google Cloud CLOUD API НАТУРАЛЬНОГО ЯЗЫКА (entity_extraction) возвращает -1 для begin_offset(как для nodejs, так и для python). Я пропускаю какие-либо параметры from google.cloud import language from google.cloud.language import enums from google.cl…
27 сен '18 в 20:58
6
ответов
Извлечение информации веб-страницы на основе шаблона в Java
Прямо сейчас я использую Jsoup для извлечения определенной информации (не весь текст) из некоторых сторонних веб-страниц, я делаю это периодически. Это работает нормально до тех пор, пока HTML-код определенной веб-страницы не изменится, это изменени…
04 мар '13 в 12:45
1
ответ
Извлечение личных атрибутов из текста
Я хотел бы извлечь личные атрибуты из текста, написанного человеком. например, Я всегда интересовался профессиональным велоспортом. Будучи одинокой матерью, никогда не было легко найти достаточно времени, чтобы заниматься спортом профессионально. Лу…
25 окт '17 в 11:59
1
ответ
Разница между распознаванием и разрешением именованного объекта?
В чем разница между распознаванием именованной сущности и разрешением именованной сущности? Был бы признателен за практический пример.
21 дек '11 в 11:22