Правильно ли я думаю о knn? (пример предоставлен)

Итак, в настоящее время я изучаю, как использовать KNN, используя евклидово и манхэттенское расстояние. Вы, ребята, мне нужны для того, чтобы просто дать обратную связь, правильно я нахожусь на правильном пути или нет.

Итак, у меня есть это изображение выше с 8 точками данных. 4 черных точки и 4 белых квадрата; тогда как белые квадраты - «положительные», а черные точки - «отрицательные».

Теперь предположим, что в этом примере у меня K = 3. Это означает, что я должен смотреть на своих трех ближайших соседей, начиная с точки 3 в этом примере, верно? Я вычисляю это расстояние, используя евклидово расстояние, такое как sqr((x2-x1)^2 + (y2-y1)^2) [для расчета расстояния между точками 3 и 4], что дает мне расстояние 3. Затем я делаю это для каждого из ближайших соседей. В конце концов, когда я вижу, что эти 3 действительно самые близкие к исходной точке, я вижу, что есть две черные точки и один белый квадрат, что означает, что точка 3 станет черной точкой вместо белого квадрата. Это также означало бы, что это ложное срабатывание. Правильный?

Затем я делаю это для каждой точки / квадрата в наборе данных, проверяю трех ближайших соседей и просто повторяю описанный выше процесс. Да?

В итоге у нас будет 4 ложных срабатывания и 4 ложных срабатывания. Теперь я хочу рассчитать точность моего выбора k = 3. Каким будет (TP + TN)/ ВСЕ ТОЧКИ ДАННЫХ В НАБОРЕ = (0 + 0)/8 = 0. Верно?

Ну наконец то. Было бы «неправильно» использовать вместо этого Манхэттен для вычисления расстояния, даже если в этом примере нет сетки? Или евклидово расстояние - наиболее верное решение? (Я считаю, что манхэттен быстрее вычисляется вручную)

Я предполагаю, что использование манхэттена с k = 3 будет тем же самым шагом, за исключением того, как вы фактически вычисляете расстояние.

В основном это делается для того, чтобы убедиться, что я сделал это правильно и на правильном ли пути в понимании.

0 ответов

Другие вопросы по тегам