Предварительная обработка изображений для глубокого обучения Tensorflow

Я сталкиваюсь с проблемой, связанной с предварительной обработкой изображения, предназначенного для обучения глубокому обучению с использованием Tensorflow.

Каждое изображение в наборе данных является спутниковым изображением, и каждое содержит сотни транспортных средств. Для каждого такого изображения у меня также есть соответствующее аннотированное изображение, которое содержит аннотацию для каждого транспортного средства. Используя исходное изображение и его аннотированный аналог, я могу создать TFrecord. Но размер файлов TFRecord слишком велик, и, следовательно, обучение вызывает проблемы.

Поэтому мне посоветовали уменьшить размер изображения. И некоторые предложения просят применить размытие по Гауссу. Мне нужно сделать оба?

Что я хочу знать, так это то, как эти этапы предварительной обработки помогут и как применять их в python?

Кроме того, я думаю, что мне также необходимо применить изменение размера к аннотированным изображениям, чтобы сохранить пространственное соотношение между транспортным средством в исходном изображении и соответствующим аннотированным пикселем в аннотированном изображении, чтобы TFRecords содержали пространственно корректную информацию. Может ли изменение размера вызвать какие-либо возможные потери в этом?

Я попытался изменить размеры (наполовину размеры) с помощью библиотек OpenCV и PIL, но я вижу некоторую потерю в пространственных отношениях.

Или я могу решить все это другими способами?

0 ответов

Другие вопросы по тегам