Watson Knowledge Studio аннотирует адреса
Я пытаюсь создать модель машинного обучения в WKS и в настоящее время занимаюсь аннотированием документов. Я хочу, чтобы модель для извлечения адресных сущностей. Моя более широкая цель - понять намерение автора переключить свой почтовый адрес со старого адреса на новый. Проблема заключается в том, что в тексте будет упоминаться два или более адреса, и модель должна различать их. Я видел примеры, где каждый кусок адреса рассматривается как отдельный объект
IE
- [735] [Аэропорт Rd], [Бисмарк], [ND] [58504] объекты: номер улицы, название улицы, город, штат, почтовый индекс
vs-
- обработка всего адреса как одного объекта [735 Airport Rd, Bismarck, ND 58504] объекта: адрес
причина, по которой я хотел бы рассматривать весь адрес как одну сущность, состоит в том, что мне нужна модель, чтобы различать старый адрес и новый адрес, и я считаю, что если я рассматриваю адрес как одну сущность, то я могу использовать связь между предложением идентификации, например как:
- новый адрес: [новый_адрес] или новый адрес [новый_адрес]
Кто-нибудь пытался сделать что-то подобное в WKS или с другим инструментом НЛП? Можно ли рассматривать каждый фрагмент адреса как сущность и определять отношения между каждым фрагментом адреса и old_address/new_address соответственно?
1 ответ
Вы можете определить тип объекта Address и аннотировать несколько токенов в качестве упоминания адреса. WKS не ограничивает упоминание одним токеном (но слишком длинная аннотация упоминания не рекомендуется)