Повышение дискретизации в семантической сегментации

Я пытаюсь реализовать статью о семантической сегментации, и я не понимаю, как использовать карту прогноза, созданную моей сетью сегментации, для соответствия размеру входного изображения.

Например, я использую вариант Resnet101 в качестве сети сегментации (как используется в статье). С этой сетевой структурой вход размером 321x321 (снова используемый в статье) создает окончательную карту прогнозирования размером 41x41xC (C - количество классов). Поскольку я должен делать предсказания на уровне пикселей, мне нужно увеличить его до 321x321xC. Pytorch предоставляет функцию Upsample для выходного размера, кратного размеру карты прогнозирования. Таким образом, я не могу напрямую использовать этот метод здесь.

Поскольку этот шаг задействован в каждой сети семантической сегментации, я уверен, что должен быть стандартный способ реализации этого.

Буду признателен за любые указатели. Заранее спасибо.

1 ответ

Решение

Может быть, самая простая вещь, которую вы можете попробовать это:

  • в 8 раз. Тогда у вас вход 41х41 превращается в 328х328
  • выполните обрезку по центру, чтобы получить желаемую форму 321x321 (например, что-то вроде этого ввода [3:,3:,:-4,:-4])
Другие вопросы по тегам