Замена существительного на местоимение в предложении

Я хочу заменить существительное в предложении его местоимением. Я буду использовать это для создания набора данных для задачи НЛП. например, если мои предложения ->

"Джек и Райан друзья. Джек также дружит с Мишель".

Затем я хочу заменить второй Джек (выделенный курсивом и жирным шрифтом) на "Он". Я сделал POS-теги, чтобы найти существительные в моих предложениях. Но я не знаю, что делать дальше. Если у меня есть список всех возможных местоимений, которые можно использовать, есть ли корпус или система, которые могут подсказать мне наиболее подходящее местоимение для этого слова?

1 ответ

Практически это можно сделать с помощью инструментов Stanford CoreNLP. Если вы запустите аннотатор "coref", он попытается определить ссылку местоимения на другие объекты, упоминаемые в тексте. Существует также аннотатор "гендер", который может назначать (бинарный) пол английскому имени (основываясь только на общей статистике частоты). (Этот аннотатор пола в настоящее время доступен только программно; его вывод не отображается в наших стандартных форматах вывода.)

Однако как разрешение кореферентности, так и автоматическое определение пола - это задачи с посредственной точностью, а во втором есть дополнительные предположения, которые делают его в целом сомнительным. Мне трудно поверить, что выполнение этого автоматически станет полезной стратегией для автоматического получения данных для задачи НЛП.

Другие вопросы по тегам