Получение прилагательного от наречия в nltk или другой библиотеке НЛП

Есть ли способ получить прилагательное, соответствующее данному наречи в NLTK или другой библиотеке Python. Например, для наречия "ужасно" мне нужно получить "ужасно". Благодарю.

2 ответа

Решение

В WordNet есть связь, которая соединяет adjectives в adverbs и наоборот.

>>> from itertools import chain
>>> from nltk.corpus import wordnet as wn
>>> from difflib import get_close_matches as gcm
>>> possible_adjectives = [k.name for k in chain(*[j.pertainyms() for j in chain(*[i.lemmas for i in wn.synsets('terribly')])])]
['terrible', 'atrocious', 'awful', 'rotten']
>>> gcm('terribly',possible_adjectives)
['terrible']

Более удобный для восприятия способ вычисленияpossible_adjective следующим образом:

possible_adj = []
for ss in wn.synsets('terribly'):
  for lemmas in ss.lemmas: # all possible lemmas.
    for lemma in lemmas: 
      for ps in lemma.pertainyms(): # all possible pertainyms.
        for p in ps:
          for ln in p.name: # all possible lemma names.
            possible_adj.append(ln)

РЕДАКТИРОВАТЬ: В более новой версии NLTK:

possible_adj = []
for ss in wn.synsets('terribly'):
  for lemmas in ss.lemmas(): # all possible lemmas
      for ps in lemmas.pertainyms(): # all possible pertainyms
          possible_adj.append(ps.name())

Как упоминал MKoosej, леммы nltk уже не атрибут, а метод. Я также сделал небольшое упрощение, чтобы получить максимально возможное слово. Надеюсь, что кто-то еще может использовать это также:

wordtoinv = 'unduly'
s = []
winner = ""
for ss in wn.synsets(wordtoinv):
    for lemmas in ss.lemmas(): # all possible lemmas.
        s.append(lemmas)

for pers in s:
    posword = pers.pertainyms()[0].name()
    if posword[0:3] == wordtoinv[0:3]:
        winner = posword
        break

print winner # undue
Другие вопросы по тегам