Преобразование прилагательных и наречий в формы существительных
Я экспериментирую с неоднозначностью смысла слова, используя wordnet для моего проекта. Как часть проекта, я хотел бы преобразовать производное прилагательное или форму наречий в форму корня существительного.
Например
красивая ==> красота замечательная ==> чудо
Как мне этого добиться? Есть ли какой-нибудь другой дикт, кроме wordnet, который обеспечивает такой вид трансформации?
Для меня было бы дополнительным бонусом, если бы я мог сопоставить точный смысл прилагательного с его формой существительного с точным смыслом. Это возможно?
Спасибо
2 ответа
Ищите в Google или SO такие термины, как 'stemming' и 'lemmatification', эти термины могут помочь вам получить то, что вы ищете.
Например, перейдите по http://qaa.ath.cx/porter_js_demo.html и введите слова "Beautiful" и "Beauty", и вы увидите, что они оба имеют одинаковый токен.
Портер Стеммер по существу удаляет общие суффиксы, найденные в английском языке, поэтому ни в коем случае не является окончательным, но это довольно хорошее место для начала.
Вы можете считать слова, которые отображаются в одном и том же стебле, в некотором смысле синонимичными. Если вы сможете приобрести часть речевых тегов и для всех этих слов, вы сможете сделать вывод, что красота - это существительное формы прилагательного "красивый".
6
Найдите в Google или SO такие термины, как «стемминг» и «лемматизация», эти термины могут помочь вам получить то, что вы ищете. Например, перейдите на http://qaa.ath.cx/porter_js_demo.html и введите слова «красивый» и «красота», и вы увидите, что они оба связаны с одним и тем же токеном. Стеммер Портера, по сути, удаляет общие суффиксы, встречающиеся в английском языке, поэтому он ни в коем случае не является окончательным, но это довольно хорошее место для начала. Вы можете считать слова, которые сопоставляются с одной и той же основой, в некотором смысле синонимами. Если вы сможете подобрать части речи для всех этих слов, вы сможете сделать вывод, что красота — это существительная форма прилагательного «красивый».