Как я могу найти степень сходства строк?

Я работаю над системой извлечения ключевых слов, после предварительной обработки система извлекает ключевые слова-кандидаты, проверяя соответствие текста тем же шаблонам

Теперь я хочу узнать, как найти сходство между выделенными значениями ключевых слов-кандидатов? Например, давайте посмотрим на следующую матрицу:

     k1   k2   k3

k1   1    ?1   ?2

k2   ?1   1    ?3

k3   ?2   ?3   1


how can I find the values of (?) ??? 
where 
    (?1) refer to the sense similarity degree between (k1) and (k2)
    (?2) refer to the sense similarity degree between (k1) and (k3)
    (?3) refer to the sense similarity degree between (k2) and (k3)

примечание: ключевое слово может быть 1 словом или более

1 ответ

Возможно, вы захотите проверить WordNet:: Сходство - он обеспечивает меры сходства между значениями слов, как в WordNet

http://wn-similarity.sourceforge.net/

Другие вопросы по тегам