Ошибка в коде R для создания модели с использованием алгоритма KNN для интеллектуального анализа текста
Я пытаюсь провести некоторый анализ текста на 35000 строк данных, и когда я пытаюсь создать модель из modeldata, я беру строки, которые я решил использовать для обучения и тестирования. И я также подаю в модель известные категории обучающих данных.
Я получаю эту ошибку.
Ошибка в knn(modeldata[train, ], modeldata[test, ], cl[train]): слишком много связей в knn
Любые предложения, как это исправить.
Я установил семя для 100.
С уважением, Рен.
1 ответ
Похоже, что исходный код определяет максимальное количество связей равным 1000. См. Здесь для ответа в списке рассылки R или здесь для источника.
Если вы симулируете свои данные, возможно, вам следует подумать о том, является ли ваша схема симуляции данных реалистичной. В качестве альтернативы вы используете различные варианты реализации, например, https://cran.r-project.org/package=kknn https://cran.r-project.org/package=FNN...