Как найти важную переменную, используя knn в R

Я хочу повысить точность, используя алгоритм KNN.

У меня есть 23 фактора (пол, возраст, оплата, образование и т. Д.)

Проблема в том, что существует слишком много переменных, поэтому я хочу знать, какие из них являются эффективными.

[Информация]

  • набор данных -> 10000 строк, 24 столбца

  • последний столбец по умолчанию (1= да, 0= нет)

Я разделил 7000 на тренировочный набор и 3000 на тестовый набор. Когда я использую все переменные, я получил классификацию ошибок около 1000. Кроме того, использование кривой ROC показывает 800 ошибок. Но я хочу уменьшить количество ошибок больше. Какой метод я могу сделать?? Если вы напишите пример кода, это будет полезно!:)

0 ответов

Другие вопросы по тегам