Загрузка файлов в категоризированный текстовый корпус

Я использую Ubuntu и, как часть моего задания, я делаю анализ текстовых настроений. Я делаю учебный набор для классификации текста с использованием классификатора NaiveBayes, у меня есть много файлов, содержащих предложения и сохранены как sent1.txt, sent2.txt.,, и файл с именем label.txt

label.txt содержит sent1.txt:pos sent2.txt:pos ... отправлено 15:txt:neg sent16.txt:neg

все отправленные файлы и файлы lable.txt хранятся в \home\abha. Я попробовал это

from nltk.corpus.reader import CategorizedPlaintextCorpusReader
reader = CategorizedPlaintextCorpusReader('.', r'.*\.txt', cat_file='cats/cats.txt')

Скажите, пожалуйста, каким должен быть мой третий аргумент?

У меня такие глупые проблемы с тем, где хранить файл label.txt и отправленные файлы.

0 ответов

Другие вопросы по тегам