Английские лемматизаторы баз?
Знаете ли вы достаточно большую базу данных лемматизатора, которая возвращает правильный результат для следующих примеров слов:
geese: goose
plantes: //not found
Морфологического анализатора Wordnet недостаточно, поскольку он дает следующие неверные результаты:
geese: //not found
plantes: plant
2 ответа
MorphAdorner, кажется, лучше в этом, но он все еще находит неправильный результат для "плант"
plantes: plante
geese: goose
Может быть, вы захотите использовать MorphAdorner для лемматизации, а затем сравнить его результаты с WordNet. Вы можете использовать WordNet API для поиска без предварительной лемматизации, вызвав findtheinfo_ds
, Это позволяет вам сначала использовать лемматизатор, такой как MorphAdorner. (Если вы хотите использовать леммайзер, вам нужно позвонить morph
отдельно и позвони findtheinfo_ds
на леммах, которые он вернул.)
С другой стороны, я потратил около 5 секунд, чтобы посмотреть на MorphAdorner для этой цели, и может быть способ устранить неправильный ответ "Plantes" без использования какого-либо другого внешнего ресурса.