Pytorch-учебник: странный входной аргумент в определении класса
Я читаю некоторые уроки Pytorch. Ниже приведено определение остаточного блока. Однако в forward
метод каждый дескриптор функции принимает только один аргумент out
в то время как в __init__
Функция этих функций имеет разное количество входных аргументов:
# Residual Block
class ResidualBlock(nn.Module):
def __init__(self, in_channels, out_channels, stride=1, downsample=None):
super(ResidualBlock, self).__init__()
self.conv1 = conv3x3(in_channels, out_channels, stride)
self.bn1 = nn.BatchNorm2d(out_channels)
self.relu = nn.ReLU(inplace=True)
self.conv2 = conv3x3(out_channels, out_channels)
self.bn2 = nn.BatchNorm2d(out_channels)
self.downsample = downsample
def forward(self, x):
residual = x
out = self.conv1(x)
out = self.bn1(out)
out = self.relu(out)
out = self.conv2(out)
out = self.bn2(out)
if self.downsample:
residual = self.downsample(x)
out += residual
out = self.relu(out)
return out
Кто-нибудь знает, как это работает? Это стандартная функция наследования классов Python или это специфично для Pytorch?
2 ответа
Вы определяете слой в функции init, что означает параметры. В функции пересылки вы вводите только те данные, которые должны быть обработаны с предопределенными настройками из init. Все, что строит функцию с настройками, которые вы ей передаете. Затем эта функция может быть использована вперед, и эта функция принимает только один аргумент.
Вы определяете различные уровни вашей сетевой архитектуры в конструкторе класса (__init__
функция). По сути, когда вы создаете экземпляр разных слоев, вы инициализируете их с вашими параметрами настройки.
Например, когда вы объявляете первый слой свертки, self.conv1
Вы даете параметры, необходимые для инициализации слоя. В функции forward вы просто вызываете слои с входом, чтобы получить соответствующий вывод. Например, в out = self.conv2(out)
, вы берете выходные данные предыдущего слоя и даете его в качестве входных данных следующего self.conv2
слой.
Обратите внимание, что во время инициализации вы предоставляете информацию слою о том, какой тип / форма ввода будет предоставлена этому слою. Например, вы говорите первому слою свертки, что будет количеством входных и выходных каналов на вашем входе. В методе forward вам просто нужно передать ввод, вот и все.