Английские лемматизаторы баз?

Знаете ли вы достаточно большую базу данных лемматизатора, которая возвращает правильный результат для следующих примеров слов:

geese: goose
plantes: //not found

Морфологического анализатора Wordnet недостаточно, поскольку он дает следующие неверные результаты:

geese: //not found
plantes: plant

2 ответа

Решение

MorphAdorner, кажется, лучше в этом, но он все еще находит неправильный результат для "плант"

plantes: plante
geese: goose

Может быть, вы захотите использовать MorphAdorner для лемматизации, а затем сравнить его результаты с WordNet. Вы можете использовать WordNet API для поиска без предварительной лемматизации, вызвав findtheinfo_ds, Это позволяет вам сначала использовать лемматизатор, такой как MorphAdorner. (Если вы хотите использовать леммайзер, вам нужно позвонить morph отдельно и позвони findtheinfo_ds на леммах, которые он вернул.)

С другой стороны, я потратил около 5 секунд, чтобы посмотреть на MorphAdorner для этой цели, и может быть способ устранить неправильный ответ "Plantes" без использования какого-либо другого внешнего ресурса.

Когда-то кто-то предложил мне Morpha, но я не использовал ее, поэтому я не знаю, будет ли она лучше, чем WordNet.

Другие вопросы по тегам