Каковы лучшие алгоритмы в реальном времени для сегментации изображения и обнаружения объектов (в помещении)?

Я хочу сегментировать внутреннюю область и находить объекты. Затем я хочу использовать стереозрение, чтобы найти декартово положение объектов. Конечная цель - собирать объекты на столе (и контролировать траекторию) роботом.

Пример объекта: стул, стол, ручка, шприц, степлер, чашка, винт, игрушечная кукла, линейка, коробочка, молоко, фрукты,....

Мой первый приоритет - быть в режиме реального времени (10 Гц).

Я использую ZED Stereo Camera для захвата изображений в Windows 10 64 бит, MATLAB 2016b 64 бит, на Intel Core i7-3820 (3,6 ГГц).

Вывод камеры цветной 720x2560 пикселей, представляющий собой комбинацию двух (правое и левое изображение) 720x1280.

Я предпочитаю использовать неконтролируемые алгоритмы для определения положения неизвестного объекта на столе. Тем не менее, он должен быть в режиме реального времени. Если это невозможно в режиме реального времени, я ухудшу свои ожидания и буду использовать контролируемые алгоритмы для поиска предопределенного объекта.

1 ответ

Я полагаю, что обе проблемы, которые вы упоминаете (сегментация и обнаружение), по-прежнему считаются открытыми, поэтому окончательного решения не существует. Тем не менее, в последние годы было проделано много работ по решению проблем обнаружения объектов и семантической сегментации с использованием глубокого обучения с высокой производительностью и скоростью.

Для обнаружения объектов в режиме реального времени я рекомендую вам проверить результаты YOLO и SSD и взглянуть также на Faster R-CNN, поскольку ваши требования 10 Гц могут быть архивированы для него.

В случае сегментации объектов вы можете попробовать с DCNN, который требует 8 кадров в секунду. Есть и другие, такие как DeepLab или FCN, но мне не ясно, какова скорость этих систем / архитектур.