Как получить оценку релевантности термина по отношению к тексту / документу
Я работаю над литературными документами. Я могу идентифицировать важные объекты, используя NER и Онтологии. Теперь я хотел бы назначить оценку релевантности идентифицированным объектам по отношению к документу. Мне нужен подход, чтобы добраться до этого, для релевантности я также хотел бы рассмотреть косвенное вхождение сущностей. Например, в документе после первого появления сущности (по его названию) его можно ссылаться с помощью таких терминов, как это, это, что..так далее. Я пробовал частотные подходы, но не получил должных результатов.
Любая помощь приветствуется.
1 ответ
Для оценки релевантности объектов вы можете измерить семантическое сходство между ними. Для сущностей в одном и том же документе мы можем ожидать, что они должны иметь некоторую семантику. Вы можете попробовать с wordnet: https://github.com/lasigeBioTM/DiShIn чтобы рассмотреть косвенное вхождение сущностей, вам следует искать инструменты разрешения анафоры.