КНН выбирает классную метку, когда к =4

В классификации k-NN выходные данные являются членами класса. Объект классифицируется большинством голосов своих соседей, при этом объект присваивается классу, наиболее распространенному среди его k ближайших соседей (k является положительным целым числом, обычно небольшим).

  1. Если k = 1, то объект просто присваивается классу этого единственного ближайшего соседа.
  2. Если k=3, а метки класса являются хорошими =2, плохими = 1, то прогнозируемая метка класса будет хорошей, что содержит голос большинства.
  3. Если k=4, а метки класса являются хорошими =2, плохими =2, что будет меткой класса?

2 ответа

Решение

Есть разные подходы. Например, Matlab использует "случайный" или "ближайший", как описано здесь.

При классификации более чем в две группы или при использовании четного значения для k может потребоваться разорвать связь по количеству ближайших соседей. Варианты "случайный", который выбирает случайный разрыв связи, и "ближайший", который использует ближайшего соседа среди связанных групп, чтобы разорвать связь.

Эта проблема не характерна для k=4.

Рассмотрим набор данных с 3 классами. При k = 2 могут возникнуть два разных класса. При k=3 могут возникать три разных класса, при k=4 это может быть 0,2,2... любой k, кроме 1, несет риск ничьей.

Выберите один случайным образом или используйте взвешивание (т. Е. Придавайте 1NN больший вес, чем 2-й ближайший сосед и т. Д.), Чтобы еще больше снизить риск связей.

Другие вопросы по тегам