Создать PASCAL Voc для API обнаружения объектов Tensorflow

Этот вопрос является продолжением этого.

TLDR; Я пытаюсь обучить API обнаружения объектов TS, используя мой собственный набор данных. Для подтверждения концепции я решил привязать свой набор данных к тесту Pascal VOC 2012.

В данный момент я пытаюсь создать TFRecord из моих аннотаций POCAL VOC.

Глядя на эту строку в своем скрипте create_pascal_tf_record.py, они просто хватают дескриптор аэроплана; удача лучшего слова, текстовый файл. Почему это так? А как насчет дескрипторов других классов?

Примечание

Этот файл; под названием aeroplane_train.txt, был включен вместе с набором данных Pascal VOC 2012 в VOC2012/ImageSets/Main/.

Посмотрев в файл, первая запись представляет имя изображения, а -1 или 1 указывает, состоит ли это конкретное изображение из класса (самолета), который нас интересует.

Частичное содержимое файла aeroplane_train.txt

2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033  1
2008_000036 -1
2008_000037  1
2008_000041 -1
2008_000045 -1
2008_000053 -1
2008_000060 -1
2008_000066 -1
2008_000070 -1
2008_000074 -1
2008_000085 -1
2008_000089 -1
2008_000093 -1
2008_000095 -1
2008_000096 -1
2008_000097 -1
2008_000099 -1
2008_000103 -1
2008_000105 -1
2008_000109 -1
2008_000112 -1
2008_000128 -1
2008_000131 -1
2008_000132 -1
2008_000141 -1

1 ответ

Решение

Я ответил на аналогичный вопрос здесь. Суть в том, что в настоящее время мы смотрим только на первый столбец файла aeroplane_train.txt (который совпадает с другими файлами xxx_train.txt) и позволяют нам определить путь для каждого изображения в обучающем наборе.

Другие вопросы по тегам