Spacy - компоновщик объектов - почему прогнозируемая оценка представляет собой комбинацию вероятности и косинуса симуляции?

Я просматривал метод прогнозирования для конвейера компоновщика сущностей в spacy, и по какой-то причине оценка определяется следующим образом:

scores = prior_probs + sims - (prior_probs*sims)

Ссылка здесь

Кто-нибудь имеет опыт в этом / знает, откуда эта формула?

Благодарность!

1 ответ

Решение

Он взят из уравнения 2 раздела 4 " Связывание сущностей через совместное кодирование типов, описаний и контекста ".

Я не чувствую себя достаточно уверенно в подробном объяснении формулы, в целом цель состоит в том, чтобы объединить оценки вероятности для подходящих кандидатов, полученные из внешних ресурсов, основанных на знаниях (KB в документе), которые являются априорными вероятностями, и оценки, оцененные с помощью кодировщик предложений, используемый для кодирования упоминания для связи вместе с его контекстом, sims в формуле, потому что они вычисляют косинусное сходство между закодированным вектором упоминания и всеми кандидатами в сущности (вот почему эта формула используется, только если "incl_context" истинно).

Другие вопросы по тегам