Подходы глубокого обучения для обнаружения редких объектов на основе YOLO, RCNN и т. Д.
Я стремлюсь создать детектор объектов, чтобы выполнять обнаружение таких объектов, как обнаружение транспортных средств и зданий, используя служебные изображения, такие как xView. Скажем, у меня есть два набора данных: 1) данные с обильными обилиями ограничивающих рамок в изображениях всей сцены и 2) намного меньший набор данных с очень небольшим количеством меток для редких классов, которые я сгенерировал или синтезировал (например, синтетические данные из САПР) модели) без ограничивающих надписей (только метки уровня изображения) без какого-либо фонового контекста или сцены.
Как я могу интегрировать изображения из набора данных 2 в обучение глубокой сети, такой как RCNN или YOLO, чтобы увеличить количество меток набора данных 1, чтобы найти эти редкие классы?