Формат данных для быстрого текста Python
Я хочу построить и протестировать классификатор. Я сделал 2 файла - train.txt и test.txt
train.txt / test.txt
__label__1, (текст)\n
__label__2, (текст)\n
__label__3, (текст)\n
и так далее. После построения классификатора:
classifier = fasttext.supervised("train.txt","model")
result = classifier.test("test.txt")
Точность всегда равна 1/n (n - количество строк). Таким образом, классификатор предназначен для каждого входа, возвращающего одну и ту же сущность (например, 2 для всех входов).
1 ответ
Вам не нужно иметь запятую между меткой и текстом. Все метки должны иметь префикс (как в вашем примере) и находиться перед текстом в файлах train и test.