Описание тега nearest-neighbor

Ближайшие соседи - это точки (или другие объекты), находящиеся в непосредственной близости от заданного места в некотором многомерном пространстве, например плоскости. Поиск таких соседей лежит в основе нескольких алгоритмов для различных приложений.
2 ответа

2D KD Tree и поиск ближайшего соседа

В настоящее время я реализую KD Tree и поиск ближайшего соседа, следуя алгоритму, описанному здесь: http://ldots.org/kdtree/ Я сталкивался с несколькими различными способами реализации дерева KD: один, в котором точки хранятся во внутренних узлах, и…
19 янв '15 в 15:56
0 ответов

Не может импортировать ближайших соседей в scikit-learn 0.16

Python 3.4.3 (v3.4.3:9b73f1c3e601, 23 февраля 2015, 02:52:03) [GCC 4.2.1 (Apple Inc., сборка 5666) (точка 3)] на darwin Тип "help", "copyright", " кредиты "или" лицензия "для получения дополнительной информации. import sklearn sklearn.__version__ '0…
08 май '15 в 12:51
2 ответа

Евклидово расстояние между двумя наборами трехмерных точек

Как я могу найти ближайшие точки из двух наборов трехмерных точек (с разным числом, набор 1 включает в себя 400 точек, а набор 2 включает в себя 2000 точек), а затем найти евклидово расстояние между набором 1 и результатом первой части вопроса?
26 фев '13 в 16:14
2 ответа

КНН выбирает классную метку, когда к =4

В классификации k-NN выходные данные являются членами класса. Объект классифицируется большинством голосов своих соседей, при этом объект присваивается классу, наиболее распространенному среди его k ближайших соседей (k является положительным целым …
3 ответа

Найти единственного ближайшего соседа, используя дерево префиксов в O(1)?

Я читаю статью, где они упоминают, что им удалось найти единственного ближайшего соседа в O(1), используя префиксное дерево. Я опишу общую проблему, а затем классическое решение и, наконец, предлагаемое решение в статье: Проблема: учитывая список би…
2 ответа

Повторяющиеся узлы при удалении из kdtree

Я пишу алгоритм, который требует от меня искать ближайших соседей точек. В этом посте я нашел библиотеку kdtree ( используя библиотеку CD Tree от Google), но в ней нет функции удаления отдельных узлов из дерева. Поэтому я начал реализовывать свой со…
11 авг '16 в 10:16
1 ответ

Классификация с использованием приблизительных ближайших соседей в Scikit-Learn

У меня есть помеченный набор данных, имеющий набор функций 46D и около 5000 выборок, которые я хочу классифицировать, используя Приблизительные ближайшие соседи. Поскольку я знаком с Scikit-Learn, я хочу использовать его для достижения этой цели. До…
1 ответ

Поиск с помощью HDF5

Я пытаюсь выполнить поиск больших данных с ограниченной памятью. Я использую HDF5 и Python. Я попробовал линейный поиск грубой силы (используя pytables) и поиск по дереву kd (используя sklearn) Удивительно, но метод kd-дерева занимает больше времени…
4 ответа

Найти ближайшего соседа более питоническим способом

A - это точка, а P - список точек. Я хочу найти, какая точка P[i] является ближайшей к A, т.е. я хочу найти P[i_0] с: i_0 = argmin_i || A - P[i]||^2 Я делаю это так: import numpy as np # P is a list of 4 points P = [np.array([-1, 0, 7, 3]), np.array…
06 дек '15 в 09:45
1 ответ

KNN поиск с OpenCV в Python

У меня есть этот пример кода для OpenCV в C++: flann::KDTreeIndexParams indexParams; flann::Index kdtree(Mat(cloud2d).reshape(1), indexParams); vector<float> query; query.push_back(370); query.push_back(464); vector<int> indices; vector&…
1 ответ

Использовать хеширование с учетом локальности для динамического набора данных

Я использую LSH для записей базы данных, и тем самым я создаю индекс (не индекс базы данных, простую хэш-карту), где подобные записи блокируются в одном и том же сегменте. База данных может содержать несколько миллионов записей. Мой вопрос касается …
2 ответа

Найти ближайшего соседа точек с одинаковым значением при сравнении двух разных наборов данных в R

У меня есть 2 кадра данных (df1 и df2), которые состоят из трех столбцов; x координата, y координата, категория (с 5 уровнями AE). Таким образом, у меня, по сути, есть 2 набора данных точек, каждая из которых относится к категории. например X Y Cat …
04 фев '16 в 14:41
0 ответов

Почему я получаю такую ​​большую потерю в своей реализации k-Nearest Neighbor?

Я пытаюсь реализовать K-NN в Matlab. У меня есть матрица из 214 х, которые имеют 9 столбцов атрибутов, а 10-й столбец является меткой. Я хочу измерить потери с помощью функции 0-1 на 10 перекрестных проверочных тестах. У меня есть следующий код: fun…
11 ноя '15 в 19:55
1 ответ

Как найти все числа которые там расстояние от заданной точки меньше или равно целому n

С учетом набора точек D и некоторого числа K I нужно найти все числа, находящиеся в D, такие, чтобы расстояние между K и любым найденным числом было меньше или равно целому числу N? Пример: предположим, что у нас D={5,9,0,6,7} и K=8 и N=1, тогда рез…
04 фев '19 в 18:08
0 ответов

Вычисления с плавающей точкой и неравенство треугольника

Я использую VPTree для оптимизации некоторых алгоритмов K-ближайших соседей. VPTree требует, чтобы функция расстояния удовлетворяла неравенству треугольника. Неравенство треугольника утверждает, что должно быть верно следующее: distance(x,z) <= d…
2 ответа

Среднее значение столбца data.table, указанное с использованием матрицы

У меня есть data.table, содержащий значения x,y,z в 10000 точек (для этого примера) в единичном кубе, и каждая точка имеет соответствующий атрибут (называемый P). Я использовал nn2 от RANN пакет для поиска индексов k-соседей (до 50) каждой точки в р…
24 сен '17 в 01:03
1 ответ

Как решить ближайший сосед эвристический

Я пытаюсь решить эвристику ближайшего соседа для tsp на небольшом примере с 2d-массивом в C++. Это мой код сейчас. Я хочу создать туры с начальными узлами от 0 до 6, чтобы потом сравнить их (какой из них имеет наименьшее расстояние). Тем не менее, п…
04 фев '16 в 09:08
1 ответ

Ближайший сосед на момент времени

Скажем, у меня есть две таблицы (SQL Fiddle). Один, который записал значения в различные временные метки, другой указывает идентификаторы и даты и время для выборки для ближайших значений. Используя что-то похожее на ПРЕФЕРЕНЦИЮ ПОСЛЕДНЕЙ СВЯЗИ КЕВИ…
1 ответ

Алгоритм или библиотека ближайшего соседа на основе ключевых слов

Я хочу найти библиотеку или алгоритм (поэтому я сам пишу код) для определения ближайших k соседей веб-страницы, где веб-страница определяется как набор ключевых слов. Я уже сделал ту часть, где я извлекаю ключевые слова. Это не должно быть очень хор…
15 май '11 в 05:08
1 ответ

Ближайший сосед в pyspark, использующий евклидово расстояние или подобное

Поэтому мне нужно найти ближайших соседей данного ряда в pyspark DF, используя евклидово расстояние или что-нибудь еще. данные, которые у меня есть более 20 столбцов, более тысячи строк и все значения являются числами. Я пытаюсь пересчитать некоторы…
15 сен '16 в 10:43