Использование дескрипторов SURF для обнаружения нескольких экземпляров объекта. (в OpenCV)
Я пишу программу в OpenCV, которая должна обнаруживать объекты в сцене, а именно продукты в супермаркете.
Я планирую использовать дескрипторы SURF для этой цели, однако все, что я до сих пор нашел, связано с обнаружением 1 вхождения объекта в сцене (обычно с сопоставлением ближайшего соседа), и я абсолютно ничего не нашел об обнаружении объектов в сцене с несколькими экземплярами одного и того же объекта (NN, очевидно, не работает, так как наилучшее совпадение для каждой точки может быть в разных экземплярах).
Мне также нужно использовать классификатор, такой как искусственные нейронные сети, который может быть более полезен при поиске нескольких экземпляров объекта, однако я не понимаю, как использовать ANN (или любой другой классификатор) с ключевыми точками.
Должен ли я использовать ¿64? Значения каждой точки SURF в качестве входных данных ANN, и каждый из, скажем, 5 продуктов, в качестве выходных данных? Это означает, что все точки (которые не похожи) в пределах одного объекта будут давать одинаковый результат.
Я читал, что это путь, но я не понимаю, как это могло бы работать, поскольку все ключевые точки в одном объекте могут (и должны) иметь разные характеристики. Но я не могу придумать другого способа сделать это.
Извините, если я не очень хорошо объяснил это, я постараюсь уточнить, если что-то недостаточно ясно.
1 ответ
У меня была похожая проблема. Я сделал следующее:
- Используйте раздвижное окно. Сметает с ROI различных размеров во всем изображении. Размер ROI должен быть больше или меньше размера ожидаемого объекта.
- Для каждого патча выявляют функции и выполняет сопоставление. Если объект обнаружен, установите область на ноль в основном изображении.
- Перейти к следующему патчу и повторить.
Но это может быть немного медленно с SURF (если вам нужно развернуть много ROI), поэтому я использовал детектор функций FAST и дескриптор BRISK, чтобы ускорить процесс. Это сработало хорошо.