Watson Knowledge Studio аннотирует адреса

Я пытаюсь создать модель машинного обучения в WKS и в настоящее время занимаюсь аннотированием документов. Я хочу, чтобы модель для извлечения адресных сущностей. Моя более широкая цель - понять намерение автора переключить свой почтовый адрес со старого адреса на новый. Проблема заключается в том, что в тексте будет упоминаться два или более адреса, и модель должна различать их. Я видел примеры, где каждый кусок адреса рассматривается как отдельный объект

IE

  • [735] [Аэропорт Rd], [Бисмарк], [ND] [58504] объекты: номер улицы, название улицы, город, штат, почтовый индекс

vs-

  • обработка всего адреса как одного объекта [735 Airport Rd, Bismarck, ND 58504] объекта: адрес

причина, по которой я хотел бы рассматривать весь адрес как одну сущность, состоит в том, что мне нужна модель, чтобы различать старый адрес и новый адрес, и я считаю, что если я рассматриваю адрес как одну сущность, то я могу использовать связь между предложением идентификации, например как:

  • новый адрес: [новый_адрес] или новый адрес [новый_адрес]

Кто-нибудь пытался сделать что-то подобное в WKS или с другим инструментом НЛП? Можно ли рассматривать каждый фрагмент адреса как сущность и определять отношения между каждым фрагментом адреса и old_address/new_address соответственно?

1 ответ

Вы можете определить тип объекта Address и аннотировать несколько токенов в качестве упоминания адреса. WKS не ограничивает упоминание одним токеном (но слишком длинная аннотация упоминания не рекомендуется)

Другие вопросы по тегам