Python: pos-тег - со словом "назад"

Как отличить тег post от back в следующих предложениях:

  1. испытывает периодическую стреляющую боль в нижней части спины после столкновения
  2. где-то в затылке

Примеры из простора

doc = nlp(u'experiencing intermittent shooting pain in her lower back following the collision')

for token in doc:
    print(token.text, token.pos_, token.tag_, token.dep_)

#experiencing VERB VBG ROOT
#intermittent ADJ JJ amod
#shooting NOUN NN compound
#pain NOUN NN dobj
#in ADP IN prep
#her ADJ PRP$ poss
#lower ADJ JJR advmod
#back ADV RB pobj
#following VERB VBG prep
#the DET DT det
#collision NOUN NN pobj

doc = nlp(u'somewhere in the back of my head')

for token in doc:
    print(token.text, token.pos_, token.tag_, token.dep_)

#somewhere ADV RB ROOT
#in ADP IN prep
#the DET DT det
#back NOUN NN pobj
#of ADP IN prep
#my ADJ PRP$ poss
#head NOUN NN pobj

Интуитивно понятно, что "обратно" в 1 - это НОУН, а 2 - в ADV. При извлечении NOUN из вышеприведенных предложений я ожидал, что "спина" в "ее нижней части спины" будет извлечена. Итак, как это сделать?

Кроме того, запутался с результатами Pos-тегов, как узнать, работает ли Pos-теги правильно?

0 ответов

Результаты pos-тегов могут сбивать с толку.

Одна вещь, которая может помочь вам в выделении существительных. Или создайте правила для получения пользовательских фрагментов: обычно из ваших данных идентифицируются триграммы и биграммы pos-тегов, а затем используйте теги pos этих фрагментов, чтобы пометить слова в фрагменте.

Другие вопросы по тегам