Повышение дискретизации в семантической сегментации
Я пытаюсь реализовать статью о семантической сегментации, и я не понимаю, как использовать карту прогноза, созданную моей сетью сегментации, для соответствия размеру входного изображения.
Например, я использую вариант Resnet101 в качестве сети сегментации (как используется в статье). С этой сетевой структурой вход размером 321x321 (снова используемый в статье) создает окончательную карту прогнозирования размером 41x41xC (C - количество классов). Поскольку я должен делать предсказания на уровне пикселей, мне нужно увеличить его до 321x321xC. Pytorch предоставляет функцию Upsample для выходного размера, кратного размеру карты прогнозирования. Таким образом, я не могу напрямую использовать этот метод здесь.
Поскольку этот шаг задействован в каждой сети семантической сегментации, я уверен, что должен быть стандартный способ реализации этого.
Буду признателен за любые указатели. Заранее спасибо.
1 ответ
Может быть, самая простая вещь, которую вы можете попробовать это:
- в 8 раз. Тогда у вас вход 41х41 превращается в 328х328
- выполните обрезку по центру, чтобы получить желаемую форму 321x321 (например, что-то вроде этого ввода [3:,3:,:-4,:-4])