как представить слова тег, число, пол и кореференцию с помощью Weka?
Я новичок в использовании Weka. Я уже создал программу, которая решает местоименную анафору с помощью C#, но теперь я хотел бы сделать то же самое с помощью Weka и сравнить оба.
Я не знаю, как моделировать свои кейсы. Мне нужно работать с грамматическими тегами слов (существительное, глагол, местоимение и т. Д.), А также учитывать число и род слов. Я также учел расстояние от местоимения до существительного, когда решал кореферент в своей программе на C#.
Мои вопросы:
Как слова представлены с помощью Weka? Учитывая, что я должен представить, глагол это, существительное, какое у них число, род и т. Д.
Как каждый решенный кореферентный кейс должен быть представлен на
@data
пройти обучение? Что-то вроде этого? (извините за неправильный синтаксис Weka, это просто псевдокод)@data word1{proper noun, singular, feminine}, word2{verb}, word3{pronoun, singular, feminine}, solution{word3, word1, distance:2}
Любые документы / примеры / что-либо о разрешении кореференции с использованием Weka?