Определить временность предложения с пометкой POS
Я хочу выяснить, было ли выполнено действие, если оно будет выполнено из серии предложений. Например: "I will prescribe this medication"
против "I prescribed this medication"
или же "He had already taken the stuff"
против "he may take the stuff later"
Я пытался tidytext
подход и решил просто искать причастие прошлого против глаголов будущего причастия. Однако, когда я POS тег, используя только типы глаголов, которые я получаю, "Verb intransitive"
, "Verb (usu participle)"
а также "Verb (transitive)"
, Как я могу получить представление о прошлых или будущих глаголах или есть другой POS-тегер, который я могу использовать?
Я стремлюсь использовать tidytext
потому что я не могу установить rjava
которые используют некоторые другие текстовые пакеты.
1 ответ
Посмотрите на морфологические особенности из udpipe
аннотаций. Они помещены в колонку подвигов аннотации. И вы можете поместить их как дополнительные столбцы в наборе данных с помощью cbind_morphological
, Все функции определены по адресу https://universaldependencies.org/u/feat/index.html Ниже вы увидите, что из предложения "Я прописал это лекарство" ниже прошедшее время, а также слово, взятое и полученное из " он уже забрал ".
library(udpipe)
x <- data.frame(doc_id = 1:4,
text = c("I will prescribe this medication",
"I prescribed this medication",
"He had already taken the stuff",
"he may take the stuff later"),
stringsAsFactors = FALSE)
anno <- udpipe(x, "english")
anno <- cbind_morphological(anno)
anno[, c("doc_id", "token", "lemma", "feats", "morph_verbform", "morph_tense")]
doc_id token lemma feats morph_verbform morph_tense
1 I I Case=Nom|Number=Sing|Person=1|PronType=Prs <NA> <NA>
1 will will VerbForm=Fin Fin <NA>
1 prescribe prescribe VerbForm=Inf Inf <NA>
1 this this Number=Sing|PronType=Dem <NA> <NA>
1 medication medication Number=Sing <NA> <NA>
2 I I Case=Nom|Number=Sing|Person=1|PronType=Prs <NA> <NA>
2 prescribed prescribe Mood=Ind|Tense=Past|VerbForm=Fin Fin Past
2 this this Number=Sing|PronType=Dem <NA> <NA>
2 medication medication Number=Sing <NA> <NA>
3 He he Case=Nom|Gender=Masc|Number=Sing|Person=3|PronType=Prs <NA> <NA>
3 had have Mood=Ind|Tense=Past|VerbForm=Fin Fin Past
3 already already <NA> <NA> <NA>
3 taken take Tense=Past|VerbForm=Part Part Past
3 the the Definite=Def|PronType=Art <NA> <NA>
3 stuff stuff Number=Sing <NA> <NA>
4 he he Case=Nom|Gender=Masc|Number=Sing|Person=3|PronType=Prs <NA> <NA>
4 may may VerbForm=Fin Fin <NA>
4 take take VerbForm=Inf Inf <NA>
4 the the Definite=Def|PronType=Art <NA> <NA>
4 stuff stuff Number=Sing <NA> <NA>
4 later later <NA> <NA> <NA>