Как я могу обнаружить и локализовать объект, используя тензорный поток и сверточную нейронную сеть?

Моя постановка проблемы заключается в следующем:

" Обнаружение и локализация объектов с использованием тензорного потока и сверточной нейронной сети "

Что я сделал?

Я закончил с обнаружением кошек по изображениям, используя библиотеку tflearn. Я успешно обучил модель, используя 25000 изображений кошек, и она отлично работает с хорошей точностью.

Текущий результат:

Что я хотел сделать?

Если мое изображение состоит из двух или более двух объектов в одном и том же изображении, например, кошка и собака вместе, поэтому мой результат должен быть "кошка и собака", и кроме этого я должен найти точное местоположение этих двух объектов на изображении (ограничительная коробка)

Я сталкивался со многими библиотеками высокого уровня, такими как darknet, SSD, но не смог понять концепцию этого.

Пожалуйста, ознакомьте меня с подходом к решению проблемы.

Примечание: я использую контролируемые методы обучения.

Ожидаемый результат:

2 ответа

Локализация изображений - сложная проблема, поскольку многие различные реализации с одинаковой эффективностью достигают одного и того же результата.

Есть 2 основных типа реализации

-Локализация объектов с регрессией

Детекторы одиночного выстрела

Прочитайте этот https://leonardoaraujosantos.gitbooks.io/artificial-inteligence/content/object_localization_and_detection.html чтобы получить лучшее представление.

ура

У вас есть несколько способов сделать это.

Самый простой способ - получить некоторые предлагаемые ограничивающие блоки с использованием некоторого алгоритма предложения ограничивающих блоков, например выборочного поиска, и запустить на каждом предложении классификационную сеть, которую вы уже обучили. Этот подход является подходом, принятым R-CNN.

Для более продвинутого алгоритма, основанного на вышеупомянутом подходе, я предлагаю вам прочитать о Fast-R-CNN и Faster R-CNN.

Посмотрите на обнаружение объектов с R-CNN? для некоторых основных объяснений.

Darknet и SSD основаны на другом подходе. Если вы хотите понять их, вы можете прочитать о них на

http://www.cs.unc.edu/~wliu/papers/ssd.pdf https://pjreddie.com/media/files/papers/yolo.pdf

Я сделал аналогичный проект (обнаружение + локализация) для индийских валют с использованием PyTorch и ResNet34. Ниже приведена ссылка на мою записную книжку kaggle, надеюсь, вы найдете ее полезной. Я вручную собрал изображения из Интернета, сделал вокруг них ограничивающую рамку и сохранил их файл аннотации (Pascal VOC) с помощью инструмента аннотации LabelImg.

https://www.kaggle.com/shweta2407/objectdetection-on-custom-dataset-resnet34

Другие вопросы по тегам