Древовидный пакет koRpus R
Во-первых, я извиняюсь за мой английский, я очень плохо говорю по-английски.
Итак, у меня есть вопрос о функции метки дерева из пакета koRpus на R. Я хочу лемматизировать текст, и это нормально для меня с Treetagger. Я использовал функцию treetag:
treetag(file, treetagger = "manual", lang = "fr",
TT.options = list(path, preset="fr"))
Я получил токены, теги...
Но после этой лемматизации я хочу получить помеченный текст, и у меня нет решения сделать это. Я хочу заменить в своем тексте каждый токен своей леммой.
Итак, у вас есть решение для меня?
Большое спасибо!
1 ответ
Proof next steps:
txt1 <- treetag(c(“played”, “saw”),
treetagger=”manual”, lang=”en”,
encoding = “UTF-8″,
TT.options=list(path=”C:/TreeTagger”, preset=”en”),
format = “obj”)
text2 <- slot(txt1 , "TT.res")
text3<- ifelse(text2$lemma == "<unknown>", text2 $token,
text2$lemma)