Лучший алгоритм классификации текстовых документов

Я хотел бы знать лучшие доступные алгоритмы для классификации текста. Я хочу классифицировать документ на основе спорта, банка, технологий и т. Д. Пожалуйста, предложите хорошие алгоритмы для получения максимальной точности.

2 ответа

Там нет лучшего алгоритма. См. "Четвертый закон сбора данных -" NFL-DM " http://khabaza.codimension.net/index_files/9laws.htm

Вам нужен алгоритм, который может обрабатывать много столбцов. Больше столбцов, чем строк, если это необходимо. Это исключает матричные алгоритмы.

Наивный Байес и SVM являются популярным выбором для классификации текста.

Хорошая точность основана не только на алгоритме машинного обучения. Это также основано на выборе функции. Попробуйте определить конкретные функции задачи или проанализируйте свое пространство функций.

Другие вопросы по тегам