Древовидный пакет koRpus R

Во-первых, я извиняюсь за мой английский, я очень плохо говорю по-английски.

Итак, у меня есть вопрос о функции метки дерева из пакета koRpus на R. Я хочу лемматизировать текст, и это нормально для меня с Treetagger. Я использовал функцию treetag:

treetag(file, treetagger = "manual", lang = "fr",
        TT.options = list(path, preset="fr")) 

Я получил токены, теги...

Но после этой лемматизации я хочу получить помеченный текст, и у меня нет решения сделать это. Я хочу заменить в своем тексте каждый токен своей леммой.

Итак, у вас есть решение для меня?

Большое спасибо!

1 ответ

Proof next steps:

txt1 <- treetag(c(“played”, “saw”),
treetagger=”manual”, lang=”en”,
encoding = “UTF-8″,
TT.options=list(path=”C:/TreeTagger”, preset=”en”),
format = “obj”)

text2 <- slot(txt1 , "TT.res")

text3<- ifelse(text2$lemma == "<unknown>", text2 $token, 
                           text2$lemma)
Другие вопросы по тегам