Извлечение именованных объектов с помощью Google NL API и Open Calais API

Я пытаюсь идентифицировать Именованные объекты по тексту и классифицировать их на Люди, Места и Организацию. Я использую Cloud Natural Language API от Google и Open Calais API для идентификации именованных объектов.

  1. Когда я ввожу текст, содержащий слово "Китай", Google NL API идентифицирует его как тип "Персона". Однако его контекстное значение в документе относится к стране. Может ли Google NL API выдавать объекты на основе текстового контекста? Если так, пожалуйста, дайте мне знать, что мне не хватает.

  2. Если текст содержит слово "обама", Google NL API выводит "Обама" как Персона, тогда как Open Calais API идентифицирует "Барак Обама" как Персона. Почему это так? Каковы другие способы получить точно именованные объекты из термина в тексте, например, тот, который возвращает Open Calais?

1 ответ

Что касается (1), не могли бы вы поделиться своим предложением? Я пробовал несколько предложений типа "Я путешествую в Китай" или "Знаете ли вы кого-нибудь в Китае", и он возвращает Location как тип для Китая (вы можете попробовать быстро на https://cloud.google. com / естественный язык /)

Что касается (2), NL API извлекает сущность из текста. Таким образом, если в тексте есть "Обама", он будет извлекать "Обама", а если это "Барак Обама", он извлекает как так. Тем не менее, он разрешит оба случая правильно на правой странице википедии и вернет одинаковое MID для обоих случаев. Таким образом, вы можете извлечь информацию из них.

Другие вопросы по тегам