Ошибка в коде R для создания модели с использованием алгоритма KNN для интеллектуального анализа текста

Я пытаюсь провести некоторый анализ текста на 35000 строк данных, и когда я пытаюсь создать модель из modeldata, я беру строки, которые я решил использовать для обучения и тестирования. И я также подаю в модель известные категории обучающих данных.

Я получаю эту ошибку.

Ошибка в knn(modeldata[train, ], modeldata[test, ], cl[train]): слишком много связей в knn

Любые предложения, как это исправить.

Я установил семя для 100.

С уважением, Рен.

1 ответ

Похоже, что исходный код определяет максимальное количество связей равным 1000. См. Здесь для ответа в списке рассылки R или здесь для источника.

Если вы симулируете свои данные, возможно, вам следует подумать о том, является ли ваша схема симуляции данных реалистичной. В качестве альтернативы вы используете различные варианты реализации, например, https://cran.r-project.org/package=kknn https://cran.r-project.org/package=FNN...

Другие вопросы по тегам