Повторение названного объекта в разрешении кореференции
Я пытаюсь найти основные ссылки для следующего текста, используя neuralcoref:
Алан и Брудер - большие друзья Криса и Дональда. Алан и Брудер хотят отправиться в Ливан, а Крис и Дональд хотят остаться в Соединенных Штатах. Крис и Дональд еще не определились, но скоро доберутся до него. Алан и Брудер не хотят разлучаться, но, похоже, у них нет выбора.
Код:
case_a_bi = 'Alan and Bruder are great friends with Chris and Donald. Alan
and Bruder want to head to Lebanon while Chris and Donald wish to stay in
United States. Chris and Donald have not made up their mind yet, but will
get there soon. Alan and Bruder do not want to separate but there seems to
be no choice.'
nlp = spacy.load('en')
neuralcoref.add_to_pipe(nlp)
case_a_bi = unidecode(case_a_bi)
doc = nlp(case_a_bi)
doc._.coref_clusters
doc._.coref_resolved
Вывод для кластеров coref:
[Alan and Bruder: [Alan and Bruder, Alan, Alan and Bruder, Alan, Alan and Bruder],
Chris: [Chris, Chris, Chris],
Chris and Donald: [Chris and Donald, Chris and Donald, Chris and Donald, their],
Donald: [Donald, Donald, Donald]]
Вывод для разрешения coref:
Алан и Брудер - большие друзья Криса и Дональда. Алан и Брудер хотят отправиться в Ливан, а Крис и Дональд Дональд хотят остаться в Соединенных Штатах. Крис и Дональд Дональд еще не приняли решение Криса и Дональда, но скоро доберутся до него. Алан и Брудер не хотят разлучаться, но, похоже, у них нет выбора.
Согласно упомянутым результатам, я получаю правильные кластеры для Криса и Дональда, но когда я пытаюсь разрешить эти сопоставления, Дональд повторяется дважды в результате.
Может ли кто-нибудь помочь мне понять, что здесь может быть не так?