Описание тега nearest-neighbor
Ближайшие соседи - это точки (или другие объекты), находящиеся в непосредственной близости от заданного места в некотором многомерном пространстве, например плоскости. Поиск таких соседей лежит в основе нескольких алгоритмов для различных приложений.
2
ответа
2D KD Tree и поиск ближайшего соседа
В настоящее время я реализую KD Tree и поиск ближайшего соседа, следуя алгоритму, описанному здесь: http://ldots.org/kdtree/ Я сталкивался с несколькими различными способами реализации дерева KD: один, в котором точки хранятся во внутренних узлах, и…
19 янв '15 в 15:56
0
ответов
Не может импортировать ближайших соседей в scikit-learn 0.16
Python 3.4.3 (v3.4.3:9b73f1c3e601, 23 февраля 2015, 02:52:03) [GCC 4.2.1 (Apple Inc., сборка 5666) (точка 3)] на darwin Тип "help", "copyright", " кредиты "или" лицензия "для получения дополнительной информации. import sklearn sklearn.__version__ '0…
08 май '15 в 12:51
2
ответа
Евклидово расстояние между двумя наборами трехмерных точек
Как я могу найти ближайшие точки из двух наборов трехмерных точек (с разным числом, набор 1 включает в себя 400 точек, а набор 2 включает в себя 2000 точек), а затем найти евклидово расстояние между набором 1 и результатом первой части вопроса?
26 фев '13 в 16:14
2
ответа
КНН выбирает классную метку, когда к =4
В классификации k-NN выходные данные являются членами класса. Объект классифицируется большинством голосов своих соседей, при этом объект присваивается классу, наиболее распространенному среди его k ближайших соседей (k является положительным целым …
20 янв '15 в 13:37
3
ответа
Найти единственного ближайшего соседа, используя дерево префиксов в O(1)?
Я читаю статью, где они упоминают, что им удалось найти единственного ближайшего соседа в O(1), используя префиксное дерево. Я опишу общую проблему, а затем классическое решение и, наконец, предлагаемое решение в статье: Проблема: учитывая список би…
24 июн '13 в 18:05
2
ответа
Повторяющиеся узлы при удалении из kdtree
Я пишу алгоритм, который требует от меня искать ближайших соседей точек. В этом посте я нашел библиотеку kdtree ( используя библиотеку CD Tree от Google), но в ней нет функции удаления отдельных узлов из дерева. Поэтому я начал реализовывать свой со…
11 авг '16 в 10:16
1
ответ
Классификация с использованием приблизительных ближайших соседей в Scikit-Learn
У меня есть помеченный набор данных, имеющий набор функций 46D и около 5000 выборок, которые я хочу классифицировать, используя Приблизительные ближайшие соседи. Поскольку я знаком с Scikit-Learn, я хочу использовать его для достижения этой цели. До…
28 май '16 в 11:19
1
ответ
Поиск с помощью HDF5
Я пытаюсь выполнить поиск больших данных с ограниченной памятью. Я использую HDF5 и Python. Я попробовал линейный поиск грубой силы (используя pytables) и поиск по дереву kd (используя sklearn) Удивительно, но метод kd-дерева занимает больше времени…
25 окт '13 в 06:42
4
ответа
Найти ближайшего соседа более питоническим способом
A - это точка, а P - список точек. Я хочу найти, какая точка P[i] является ближайшей к A, т.е. я хочу найти P[i_0] с: i_0 = argmin_i || A - P[i]||^2 Я делаю это так: import numpy as np # P is a list of 4 points P = [np.array([-1, 0, 7, 3]), np.array…
06 дек '15 в 09:45
1
ответ
KNN поиск с OpenCV в Python
У меня есть этот пример кода для OpenCV в C++: flann::KDTreeIndexParams indexParams; flann::Index kdtree(Mat(cloud2d).reshape(1), indexParams); vector<float> query; query.push_back(370); query.push_back(464); vector<int> indices; vector&…
18 окт '17 в 07:34
1
ответ
Использовать хеширование с учетом локальности для динамического набора данных
Я использую LSH для записей базы данных, и тем самым я создаю индекс (не индекс базы данных, простую хэш-карту), где подобные записи блокируются в одном и том же сегменте. База данных может содержать несколько миллионов записей. Мой вопрос касается …
06 сен '15 в 03:36
2
ответа
Найти ближайшего соседа точек с одинаковым значением при сравнении двух разных наборов данных в R
У меня есть 2 кадра данных (df1 и df2), которые состоят из трех столбцов; x координата, y координата, категория (с 5 уровнями AE). Таким образом, у меня, по сути, есть 2 набора данных точек, каждая из которых относится к категории. например X Y Cat …
04 фев '16 в 14:41
0
ответов
Почему я получаю такую большую потерю в своей реализации k-Nearest Neighbor?
Я пытаюсь реализовать K-NN в Matlab. У меня есть матрица из 214 х, которые имеют 9 столбцов атрибутов, а 10-й столбец является меткой. Я хочу измерить потери с помощью функции 0-1 на 10 перекрестных проверочных тестах. У меня есть следующий код: fun…
11 ноя '15 в 19:55
1
ответ
Как найти все числа которые там расстояние от заданной точки меньше или равно целому n
С учетом набора точек D и некоторого числа K I нужно найти все числа, находящиеся в D, такие, чтобы расстояние между K и любым найденным числом было меньше или равно целому числу N? Пример: предположим, что у нас D={5,9,0,6,7} и K=8 и N=1, тогда рез…
04 фев '19 в 18:08
0
ответов
Вычисления с плавающей точкой и неравенство треугольника
Я использую VPTree для оптимизации некоторых алгоритмов K-ближайших соседей. VPTree требует, чтобы функция расстояния удовлетворяла неравенству треугольника. Неравенство треугольника утверждает, что должно быть верно следующее: distance(x,z) <= d…
30 янв '14 в 17:13
2
ответа
Среднее значение столбца data.table, указанное с использованием матрицы
У меня есть data.table, содержащий значения x,y,z в 10000 точек (для этого примера) в единичном кубе, и каждая точка имеет соответствующий атрибут (называемый P). Я использовал nn2 от RANN пакет для поиска индексов k-соседей (до 50) каждой точки в р…
24 сен '17 в 01:03
1
ответ
Как решить ближайший сосед эвристический
Я пытаюсь решить эвристику ближайшего соседа для tsp на небольшом примере с 2d-массивом в C++. Это мой код сейчас. Я хочу создать туры с начальными узлами от 0 до 6, чтобы потом сравнить их (какой из них имеет наименьшее расстояние). Тем не менее, п…
04 фев '16 в 09:08
1
ответ
Ближайший сосед на момент времени
Скажем, у меня есть две таблицы (SQL Fiddle). Один, который записал значения в различные временные метки, другой указывает идентификаторы и даты и время для выборки для ближайших значений. Используя что-то похожее на ПРЕФЕРЕНЦИЮ ПОСЛЕДНЕЙ СВЯЗИ КЕВИ…
10 июн '13 в 21:18
1
ответ
Алгоритм или библиотека ближайшего соседа на основе ключевых слов
Я хочу найти библиотеку или алгоритм (поэтому я сам пишу код) для определения ближайших k соседей веб-страницы, где веб-страница определяется как набор ключевых слов. Я уже сделал ту часть, где я извлекаю ключевые слова. Это не должно быть очень хор…
15 май '11 в 05:08
1
ответ
Ближайший сосед в pyspark, использующий евклидово расстояние или подобное
Поэтому мне нужно найти ближайших соседей данного ряда в pyspark DF, используя евклидово расстояние или что-нибудь еще. данные, которые у меня есть более 20 столбцов, более тысячи строк и все значения являются числами. Я пытаюсь пересчитать некоторы…
15 сен '16 в 10:43