Как я могу обнаружить и локализовать объект, используя тензорный поток и сверточную нейронную сеть?
Моя постановка проблемы заключается в следующем:
" Обнаружение и локализация объектов с использованием тензорного потока и сверточной нейронной сети "
Что я сделал?
Я закончил с обнаружением кошек по изображениям, используя библиотеку tflearn. Я успешно обучил модель, используя 25000 изображений кошек, и она отлично работает с хорошей точностью.
Что я хотел сделать?
Если мое изображение состоит из двух или более двух объектов в одном и том же изображении, например, кошка и собака вместе, поэтому мой результат должен быть "кошка и собака", и кроме этого я должен найти точное местоположение этих двух объектов на изображении (ограничительная коробка)
Я сталкивался со многими библиотеками высокого уровня, такими как darknet, SSD, но не смог понять концепцию этого.
Пожалуйста, ознакомьте меня с подходом к решению проблемы.
Примечание: я использую контролируемые методы обучения.
Ожидаемый результат:
2 ответа
Локализация изображений - сложная проблема, поскольку многие различные реализации с одинаковой эффективностью достигают одного и того же результата.
Есть 2 основных типа реализации
-Локализация объектов с регрессией
Детекторы одиночного выстрела
Прочитайте этот https://leonardoaraujosantos.gitbooks.io/artificial-inteligence/content/object_localization_and_detection.html чтобы получить лучшее представление.
ура
У вас есть несколько способов сделать это.
Самый простой способ - получить некоторые предлагаемые ограничивающие блоки с использованием некоторого алгоритма предложения ограничивающих блоков, например выборочного поиска, и запустить на каждом предложении классификационную сеть, которую вы уже обучили. Этот подход является подходом, принятым R-CNN.
Для более продвинутого алгоритма, основанного на вышеупомянутом подходе, я предлагаю вам прочитать о Fast-R-CNN и Faster R-CNN.
Посмотрите на обнаружение объектов с R-CNN? для некоторых основных объяснений.
Darknet и SSD основаны на другом подходе. Если вы хотите понять их, вы можете прочитать о них на
http://www.cs.unc.edu/~wliu/papers/ssd.pdf https://pjreddie.com/media/files/papers/yolo.pdf
Я сделал аналогичный проект (обнаружение + локализация) для индийских валют с использованием PyTorch и ResNet34. Ниже приведена ссылка на мою записную книжку kaggle, надеюсь, вы найдете ее полезной. Я вручную собрал изображения из Интернета, сделал вокруг них ограничивающую рамку и сохранил их файл аннотации (Pascal VOC) с помощью инструмента аннотации LabelImg.
https://www.kaggle.com/shweta2407/objectdetection-on-custom-dataset-resnet34