Поезд или пользовательские типы слов Word?

Я просматривал документацию и тестировал API естественного языка Google и заметил, что некоторые люди, события, организации и местоположения неверны - похоже, он использует Википедию в качестве основного источника данных, поэтому, если он не в Википедии, он кажется есть проблемы с определением типа различных слов. Кроме того, если определенные слова появляются в имени (собственное существительное), оно, похоже, всегда идентифицирует сущность как определенный тип, который не всегда корректен.

Например: "Конгресс", кажется, всегда идентифицируется как организация [правительство], даже если он является частью названия мероприятия. Название "WordCamp" отображается как местоположение, но это событие.

Есть ли способ обучить движок Natural Language или предоставить собственный набор организаций, мест, событий и т. Д., Чтобы он предоставлял более точную информацию о типах для объектов, которые не являются чрезвычайно популярными?

1 ответ

Решение

Я менеджер по продукту для этого продукта. Пользовательские типы объектов в настоящее время не поддерживаются. Что касается вашего комментария о неправильном понимании некоторых типов сущностей, это верно для любой системы НЛП, но наша цель - продолжать улучшаться. Мы работаем над тем, чтобы вы могли предоставить нам обратную связь в тех случаях, когда мы ошиблись, чтобы улучшить нашу точность, и в скором времени поделятся подробностями. Обратите внимание, что мы обучили наши модели нескольким источникам данных, а не только данным Википедии. API возвращает наиболее релевантную статью в Википедии для обнаруженной сущности, поэтому, если сущность имеет несколько интерпретаций, мы будем возвращать только наиболее часто используемую интерпретацию.

Другие вопросы по тегам