Описание тега approximate-nn-searching

Approximate Nearest neighbor search (ANNS), also known as proximity search, similarity search or closest point search, is an optimization problem for finding closest points in metric spaces.
1 ответ

Почему k и l для LSH используются для приблизительных ближайших соседей?

Во всех объяснениях, связанных с локальным хешированием (то есть http://en.wikipedia.org/wiki/Locality-sensitive_hashing) Они описывают, что генерируются k хеш-функций, но только х (l Зачем вообще генерировать k, а не просто генерировать l? Почему о…
2 ответа

Может ли поиск ANN превосходить точность поиска NN в больших базах данных с многомерными представлениями?

Известно, что поиск ANN превосходит поиск NN с точки зрения эффективности, а некоторые методы сокращают объем памяти из компактных представлений. Но что происходит с точки зрения эффективности? Можно ли добиться такой же производительности, не найдя…
1 ответ

Измените этот алгоритм для поиска ближайшего соседа (NNS) для выполнения Approximate-NNS

Из слайдов курса я нашел следующие: Для заданного множества P в R^D и точки запроса q это NN - точка p_0 в P, где: dist(p_0, q) <= dist(p, q), for every p in P. Аналогично, с коэффициентом аппроксимации 1 > ε > 0 ε-NN равен p_0, так что: dist(p_0…
1 ответ

Использование "приблизительной" карты STL

Я хотел бы создать карту STL, чтобы определить, достаточно ли близок элемент к другому элементу в трехмерном пространстве. До сих пор мой "менее чем функтор" работал довольно хорошо, вставил по следующей ссылке. Теперь эта проблема не совсем проблем…
1 ответ

Добавление элемента в дерево VP (поддержка дерева VP)

Я читал несколько источников по VP-дереву для сходства knn. Никто не писал о добавлении элемента в существующее дерево, которое требуется для обслуживания. Объяснение добавления элемента будет просто отличным.
5 ответов

Как найти ближайшие 2 точки в 100-мерном пространстве с 500000 точек?

У меня есть база данных с 500000 точек в 100-мерном пространстве, и я хочу найти ближайшие 2 точки. Как мне это сделать? Обновление: Пространство евклидово, извините. И спасибо за все ответы. Кстати, это не домашнее задание.
1 ответ

Поиск в локальном хешировании

Я пытаюсь понять раздел 5. этой статьи о LSH, в частности, как создать сгенерированные хэши. Цитирую связанный документ: Учитывая битовые векторы, состоящие из d битов каждый, мы выбираем N = O(n 1/(1+epsilon)) случайных перестановок битов. Для кажд…
1 ответ

Использование библиотеки FLANN для классификации по нескольким меткам

Я хочу использовать библиотеку FLANN для классификации Mutli-Label. Я знаю, что библиотека FLANN предназначена для вычисления ближайших соседей, но я не уверена, как использовать ее для целей классификации. Есть ли какой-нибудь способ подключить его…
0 ответов

Как получить вывод для LSH ANN по karlhigley/spark-соседям, используя евклидово или косинусное расстояние

Я работаю с ANN, используя хеширование с учетом локальных особенностей по https://github.com/karlhigley/spark-neighbors. Я пробовал разные расстояния: хемминга, евклидова и косинусная; но когда я действительно хочу увидеть результаты вызова метода c…
1 ответ

Что такое параметр ε (epsilon) в локальном хешировании (LSH)?

Я прочитал оригинальную статью о хешировании с учетом локальных особенностей. Сложность зависит от параметра ε, но я не понимаю, что это такое. Можете ли вы объяснить его значение, пожалуйста?
1 ответ

Какие из этих структур предназначены для точного ближайшего соседа, а какие для приблизительного варианта?

LSH - это популярный алгоритм для ANN. kd Tree, пожалуй, самое популярное решение для точного решения NN. Однако, читая этот опрос, я обнаружил эти структуры и не понимаю, какие из них предназначены для решения NN или ANN: четырехъядерный / Октябрь-…
1 ответ

Реализация LSH в Python 3 с евклидовым расстоянием и видением всех соседей в LSHForest

Я ищу эффективную реализацию LSH в Python 3, который использует евклидово расстояние. Есть "в питоне" LSHForest реализация, но она использует косинусные расстояния. Кроме того, даже используя эту реализацию, я не нашел способа увидеть содержимое каж…
1 ответ

Производительность метода досады Vs. KD-Tree

Я занимаюсь исследованием приближенных алгоритмов ближайшего соседа. Недавно я нашел библиотеку "Раздражающий", которая делает удивительную работу по поиску КНН с разумной скоростью. Для более глубокого анализа вы можете просмотреть слайды встречи. …
1 ответ

КД-дерево хранит точки во внутренних узлах? Если да, то как искать NN?

Ссылка в википедии о kd-деревьях хранит точки во внутренних узлах. Я должен выполнить NN запросы, и я думаю (новичок здесь), я понимаю концепцию. Однако мне сказали, что я изучаю Kd-деревья из алгоритмов и приложений вычислительной геометрии (Де Бе…
0 ответов

Сходство между текстовыми запросами в векторном пространстве для Приблизительного ближайшего соседа?

Я хочу реализовать систему, которая кеширует наиболее популярные запросы и, учитывая новый запрос, пытается найти аналогичный запрос в кеше и вернуть тот же результат. Так как я хочу сделать это как можно более общим (запросы могут быть короткими те…
1 ответ

Два набора точек с высокой размерностью: найдите ближайшего соседа в другом наборе

У меня есть 2 набора: A и B. Оба набора содержат одинаковое количество точек высокой размерности. Как найти ближайшего соседа в наборе A для каждой точки в наборе B? Я думал об использовании диаграммы Вороного, но кажется (согласно википедии), что о…
1 ответ

Примерное совпадение строк в Ruby

Я реализую функциональность поиска пользователей в моем приложении Rails. Я хочу, чтобы приложение предложило правильное написание, если пользователь допустил ошибку при вводе правописания. Есть ли плагин для этого в ruby. Можно ли это сделать в SQL…
10 мар '11 в 10:56
3 ответа

Является ли Approximate Nearest Neighbor самым быстрым соответствием в Computer Vision?

При использовании дескрипторов объектов [например, SIFT, SURF] - является ли "Приближенный ближайший сосед" самым быстрым способом сопоставления изображений?
1 ответ

Как отключить поисковое действие JXTable по умолчанию?

У меня есть JXTable в моем приложении свинг. Когда я нажимаю Ctrl+F на таблице, открывается панель поиска по умолчанию. Эта панель находит только подстроки. Мне нужно найти похожие слова с моим InputText. Например, я пишу "test", результат может быт…
2 ответа

Лучшая структура данных для многомерного поиска ближайшего соседа

Я на самом деле работаю с данными большого размера (~50.000-100.000 объектов), и поиск ближайших соседей должен быть выполнен по ним. Я знаю, что KD-Trees имеет низкую производительность при увеличении размеров, а также я читал, что в целом все стру…