AWS Sagemaker Обнаружение нескольких объектов в распознавании / классификации изображений

Кто-нибудь знает, поддерживает ли встроенный алгоритм SageMaker обнаружение нескольких объектов при распознавании изображений? Я имею в виду что-то вроде обучения мульти-лейбл изображения и обнаружения / вывода.

Таким образом, мы можем:

а) тренируйся с использованием изображений с несколькими метками

и / или

б) выводить несколько объектов из изображений (вроде AWS Rekognition, но с пользовательскими метками и обучением / обучением).

Кроме того, я знаю, что документ для алгоритма классификации изображений SageMaker гласит "принимает изображение в качестве входных данных и классифицирует его в одну из нескольких выходных категорий".

Любые рекомендации также приветствуются.

2 ответа

Решение

Сегодня в Amazon Sagemaker появился новый встроенный алгоритм обнаружения объектов. Основываясь на документации, Amazon SageMaker Object Detection использует алгоритм Single Shot multibox Detector (SSD). Ответ от логического вывода содержит массив, состоящий из предсказанной метки класса обнаруженного объекта, ассоциированного показателя достоверности и координат ограничивающего прямоугольника.

ОБНОВЛЕНИЕ: алгоритм обнаружения объекта Checkout в SageMaker


Алгоритм классификации изображений SageMaker берет изображение и возвращает коллекцию классов и вероятностей.
Чтобы классифицировать несколько объектов в изображении, вам необходимо предварительно обработать изображение для обнаружения объектов, в результате чего получится несколько меньших изображений с одним объектом на изображение, которое вы предоставите в качестве входных данных для алгоритма классификации изображений.

Обычно обнаружение объекта является более простой задачей, чем идентификация / классификация объекта.