Обучающие данные для UnigramTagger= Brown корпус, данные тестирования = новые предложения, помеченные nltk.pos_tag
Пожалуйста, дайте мне знать, можем ли мы обучить UnigramTagger с коричневым корпусом и оценить тот же UnigramTagger на данных тестирования, которые были помечены с помощью nltk.pos_tag?
Если да, как мы можем интерпретировать точность?
Код СНиП
**data3 = []
for i in data:
data3.append(nltk.pos_tag(nltk.word_tokenize(i.lower())))
brown_tagged_sents = brown.tagged_sents(categories = ['news'])
unigram_tagger_brown = nltk.UnigramTagger(brown_tagged_sents)
accuracy_value = unigram_tagger_brown.evaluate(data3)
print("Unigram Tagger Accuracy for brown is ",accuracy_value)**