Как найти важную переменную, используя knn в R
Я хочу повысить точность, используя алгоритм KNN.
У меня есть 23 фактора (пол, возраст, оплата, образование и т. Д.)
Проблема в том, что существует слишком много переменных, поэтому я хочу знать, какие из них являются эффективными.
[Информация]
набор данных -> 10000 строк, 24 столбца
последний столбец по умолчанию (1= да, 0= нет)
Я разделил 7000 на тренировочный набор и 3000 на тестовый набор. Когда я использую все переменные, я получил классификацию ошибок около 1000. Кроме того, использование кривой ROC показывает 800 ошибок. Но я хочу уменьшить количество ошибок больше. Какой метод я могу сделать?? Если вы напишите пример кода, это будет полезно!:)