Формат данных для быстрого текста Python

Я хочу построить и протестировать классификатор. Я сделал 2 файла - train.txt и test.txt


train.txt / test.txt


__label__1, (текст)\n


__label__2, (текст)\n


__label__3, (текст)\n


и так далее. После построения классификатора:

classifier = fasttext.supervised("train.txt","model")

result = classifier.test("test.txt")

Точность всегда равна 1/n (n - количество строк). Таким образом, классификатор предназначен для каждого входа, возвращающего одну и ту же сущность (например, 2 для всех входов).

1 ответ

Вам не нужно иметь запятую между меткой и текстом. Все метки должны иметь префикс (как в вашем примере) и находиться перед текстом в файлах train и test.

Другие вопросы по тегам