Spacy - компоновщик объектов - почему прогнозируемая оценка представляет собой комбинацию вероятности и косинуса симуляции?
Я просматривал метод прогнозирования для конвейера компоновщика сущностей в spacy, и по какой-то причине оценка определяется следующим образом:
scores = prior_probs + sims - (prior_probs*sims)
Ссылка здесь
Кто-нибудь имеет опыт в этом / знает, откуда эта формула?
Благодарность!
1 ответ
Он взят из уравнения 2 раздела 4 " Связывание сущностей через совместное кодирование типов, описаний и контекста ".
Я не чувствую себя достаточно уверенно в подробном объяснении формулы, в целом цель состоит в том, чтобы объединить оценки вероятности для подходящих кандидатов, полученные из внешних ресурсов, основанных на знаниях (KB в документе), которые являются априорными вероятностями, и оценки, оцененные с помощью кодировщик предложений, используемый для кодирования упоминания для связи вместе с его контекстом, sims в формуле, потому что они вычисляют косинусное сходство между закодированным вектором упоминания и всеми кандидатами в сущности (вот почему эта формула используется, только если "incl_context" истинно).