Получение прилагательного от наречия в nltk или другой библиотеке НЛП
Есть ли способ получить прилагательное, соответствующее данному наречи в NLTK или другой библиотеке Python. Например, для наречия "ужасно" мне нужно получить "ужасно". Благодарю.
2 ответа
Решение
В WordNet есть связь, которая соединяет adjectives
в adverbs
и наоборот.
>>> from itertools import chain
>>> from nltk.corpus import wordnet as wn
>>> from difflib import get_close_matches as gcm
>>> possible_adjectives = [k.name for k in chain(*[j.pertainyms() for j in chain(*[i.lemmas for i in wn.synsets('terribly')])])]
['terrible', 'atrocious', 'awful', 'rotten']
>>> gcm('terribly',possible_adjectives)
['terrible']
Более удобный для восприятия способ вычисленияpossible_adjective
следующим образом:
possible_adj = []
for ss in wn.synsets('terribly'):
for lemmas in ss.lemmas: # all possible lemmas.
for lemma in lemmas:
for ps in lemma.pertainyms(): # all possible pertainyms.
for p in ps:
for ln in p.name: # all possible lemma names.
possible_adj.append(ln)
РЕДАКТИРОВАТЬ: В более новой версии NLTK:
possible_adj = []
for ss in wn.synsets('terribly'):
for lemmas in ss.lemmas(): # all possible lemmas
for ps in lemmas.pertainyms(): # all possible pertainyms
possible_adj.append(ps.name())
Как упоминал MKoosej, леммы nltk уже не атрибут, а метод. Я также сделал небольшое упрощение, чтобы получить максимально возможное слово. Надеюсь, что кто-то еще может использовать это также:
wordtoinv = 'unduly'
s = []
winner = ""
for ss in wn.synsets(wordtoinv):
for lemmas in ss.lemmas(): # all possible lemmas.
s.append(lemmas)
for pers in s:
posword = pers.pertainyms()[0].name()
if posword[0:3] == wordtoinv[0:3]:
winner = posword
break
print winner # undue