CoreNLP Часть речевого глагола

Я пытаюсь выполнить pos-теги для общей фразы.

Используя этот код, в соответствии с глаголом, мне возвращается только "V", но я также хотел бы получить конкретную информацию о глаголе (например, время, человек и т. Д.).

Как я могу получить конкретную информацию (VB,VBG,VBD,ecc) о теге?

void partOfSpeach(String s) throws IOException{
TintPipeline pipeline = new TintPipeline();
Properties props;
props = new Properties();
props.setProperty("annotators", "ita_toksent , ita_lemma , pos, ner, parse");
props.setProperty("pos.model", "models/italian-big.tagger");
props.setProperty("ita_toksent.model", "/Users/alessio/Desktop/token-settings.xml");
props.setProperty("customAnnotatorClass.ita_toksent", "eu.fbk.dh.tint.tokenizer.annotators.ItalianTokenizerAnnotator");
pipeline.loadDefaultProperties();
pipeline.load();
Annotation stanfordAnnotation = pipeline.runRaw(s);
List<CoreMap> sentences = stanfordAnnotation.get(SentencesAnnotation.class);
        for (CoreMap sentence : sentences) {            for (CoreLabel token : sentence.get(TokensAnnotation.class)) {
                String word = token.get(TextAnnotation.class);
                String pos = token.get(PartOfSpeechAnnotation.class);
                System.out.println(word + " " + pos);           }           }   }

Выход: Чао (I) Соно (V) Франческо (SP) Эд (CC) Хо (V) 24 (N) Анни (S)

0 ответов

Другие вопросы по тегам