Поиск входных параметров нейронной сети для классификации текстовых документов
Мне нужно обучить нейронную сеть для классификации некоторых текстовых документов в логический класс (NN имеет один выход со значениями "Да" или "Нет").
Существует ли какой-либо алгоритм для поиска наилучших входных параметров (например, наличие слов, термин, предложение и / или частота / повторение слова & ...)?
Если нет, не могли бы вы дать мне отправную точку для поиска этих параметров (как их выбрать)?
Спасибо
1 ответ
Стандартный подход, который я знаю, состоит в том, чтобы использовать вектор слов / терминов и присваивать им отрицательный или положительный балл, используя алгоритм обучения или статистический алгоритм. даже обучения перцептрону должно хватить, вам просто нужен хороший набор положительных и отрицательных примеров.
Насколько мне известно, так работают все спам-фильтры. и они работают довольно хорошо.