Повторение названного объекта в разрешении кореференции

Question

Повторение названного объекта в разрешении кореференции

Я пытаюсь найти основные ссылки для следующего текста, используя neuralcoref:

Алан и Брудер - большие друзья Криса и Дональда. Алан и Брудер хотят отправиться в Ливан, а Крис и Дональд хотят остаться в Соединенных Штатах. Крис и Дональд еще не определились, но скоро доберутся до него. Алан и Брудер не хотят разлучаться, но, похоже, у них нет выбора.

Код:

case_a_bi = 'Alan and Bruder are great friends with Chris and Donald. Alan 
and Bruder want to head to Lebanon while Chris and Donald wish to stay in 
United States. Chris and Donald have not made up their mind yet, but will 
get there soon. Alan and Bruder do not want to separate but there seems to 
be no choice.'
nlp = spacy.load('en')
neuralcoref.add_to_pipe(nlp)
case_a_bi = unidecode(case_a_bi)
doc = nlp(case_a_bi)
doc._.coref_clusters
doc._.coref_resolved

Вывод для кластеров coref:

[Alan and Bruder: [Alan and Bruder, Alan, Alan and Bruder, Alan, Alan and Bruder],

Chris: [Chris, Chris, Chris],

Chris and Donald: [Chris and Donald, Chris and Donald, Chris and Donald, their],

Donald: [Donald, Donald, Donald]]

Вывод для разрешения coref:

Алан и Брудер - большие друзья Криса и Дональда. Алан и Брудер хотят отправиться в Ливан, а Крис и Дональд Дональд хотят остаться в Соединенных Штатах. Крис и Дональд Дональд еще не приняли решение Криса и Дональда, но скоро доберутся до него. Алан и Брудер не хотят разлучаться, но, похоже, у них нет выбора.

Согласно упомянутым результатам, я получаю правильные кластеры для Криса и Дональда, но когда я пытаюсь разрешить эти сопоставления, Дональд повторяется дважды в результате.

Может ли кто-нибудь помочь мне понять, что здесь может быть не так?

1

python nlp spacy coreference-resolution

Источник

user14550443 30 окт '20 в 20:18

0 ответов

Другие вопросы по тегам python nlp spacy coreference-resolution