Определить временность предложения с пометкой POS

Я хочу выяснить, было ли выполнено действие, если оно будет выполнено из серии предложений. Например: "I will prescribe this medication" против "I prescribed this medication" или же "He had already taken the stuff" против "he may take the stuff later"

Я пытался tidytext подход и решил просто искать причастие прошлого против глаголов будущего причастия. Однако, когда я POS тег, используя только типы глаголов, которые я получаю, "Verb intransitive", "Verb (usu participle)" а также "Verb (transitive)", Как я могу получить представление о прошлых или будущих глаголах или есть другой POS-тегер, который я могу использовать?

Я стремлюсь использовать tidytext потому что я не могу установить rjava которые используют некоторые другие текстовые пакеты.

1 ответ

Решение

Посмотрите на морфологические особенности из udpipe аннотаций. Они помещены в колонку подвигов аннотации. И вы можете поместить их как дополнительные столбцы в наборе данных с помощью cbind_morphological, Все функции определены по адресу https://universaldependencies.org/u/feat/index.html Ниже вы увидите, что из предложения "Я прописал это лекарство" ниже прошедшее время, а также слово, взятое и полученное из " он уже забрал ".

library(udpipe)
x <- data.frame(doc_id = 1:4, 
                text = c("I will prescribe this medication", 
                         "I prescribed this medication", 
                         "He had already taken the stuff", 
                         "he may take the stuff later"), 
                stringsAsFactors = FALSE)
anno <- udpipe(x, "english")
anno <- cbind_morphological(anno)

anno[, c("doc_id", "token", "lemma", "feats", "morph_verbform", "morph_tense")]

 doc_id      token      lemma                                                  feats morph_verbform morph_tense
      1          I          I             Case=Nom|Number=Sing|Person=1|PronType=Prs           <NA>        <NA>
      1       will       will                                           VerbForm=Fin            Fin        <NA>
      1  prescribe  prescribe                                           VerbForm=Inf            Inf        <NA>
      1       this       this                               Number=Sing|PronType=Dem           <NA>        <NA>
      1 medication medication                                            Number=Sing           <NA>        <NA>
      2          I          I             Case=Nom|Number=Sing|Person=1|PronType=Prs           <NA>        <NA>
      2 prescribed  prescribe                       Mood=Ind|Tense=Past|VerbForm=Fin            Fin        Past
      2       this       this                               Number=Sing|PronType=Dem           <NA>        <NA>
      2 medication medication                                            Number=Sing           <NA>        <NA>
      3         He         he Case=Nom|Gender=Masc|Number=Sing|Person=3|PronType=Prs           <NA>        <NA>
      3        had       have                       Mood=Ind|Tense=Past|VerbForm=Fin            Fin        Past
      3    already    already                                                   <NA>           <NA>        <NA>
      3      taken       take                               Tense=Past|VerbForm=Part           Part        Past
      3        the        the                              Definite=Def|PronType=Art           <NA>        <NA>
      3      stuff      stuff                                            Number=Sing           <NA>        <NA>
      4         he         he Case=Nom|Gender=Masc|Number=Sing|Person=3|PronType=Prs           <NA>        <NA>
      4        may        may                                           VerbForm=Fin            Fin        <NA>
      4       take       take                                           VerbForm=Inf            Inf        <NA>
      4        the        the                              Definite=Def|PronType=Art           <NA>        <NA>
      4      stuff      stuff                                            Number=Sing           <NA>        <NA>
      4      later      later                                                   <NA>           <NA>        <NA>
Другие вопросы по тегам