Транспонировать свертку (деконволюцию) арифметику

Я использую tenorflow для построения нейронной сети свертки. Учитывая тензор формы (нет, 16, 16, 4, 192), я хочу выполнить транспонирование, которое приводит к форме (нет, 32, 32, 7, 192).

Будет ли размер фильтра [2,2,4,192,192] и шаг [2,2,1,1,1] создавать желаемую форму вывода?

1 ответ

Решение

Да, вы почти правы.

Одна небольшая поправка в том, что tf.nn.conv3d_transpose надеется NCDHW или же NDHWC Формат ввода (ваш, кажется, NHWDC) и форма фильтра, как ожидается, будет [depth, height, width, output_channels, in_channels], Это влияет на порядок размеров в filter а также stride:

# Original format: NHWDC.
original = tf.placeholder(dtype=tf.float32, shape=[None, 16, 16, 4, 192])
print original.shape

# Convert to NDHWC format.
input = tf.reshape(original, shape=[-1, 4, 16, 16, 192])
print input.shape

# input shape:  [batch, depth, height, width, in_channels].
# filter shape: [depth, height, width, output_channels, in_channels].
# output shape: [batch, depth, height, width, output_channels].
filter = tf.get_variable('filter', shape=[4, 2, 2, 192, 192], dtype=tf.float32)
conv = tf.nn.conv3d_transpose(input,
                              filter=filter,
                              output_shape=[-1, 7, 32, 32, 192],
                              strides=[1, 1, 2, 2, 1],
                              padding='SAME')
print conv.shape

final = tf.reshape(conv, shape=[-1, 32, 32, 7, 192])
print final.shape

Какие выводы:

(?, 16, 16, 4, 192)
(?, 4, 16, 16, 192)
(?, 7, 32, 32, 192)
(?, 32, 32, 7, 192)
Другие вопросы по тегам