"ValueError: Неизвестный слой: ... " при вызове copy.deepcopy(network) с использованием Tensorflow
В настоящее время я проектирую NoisyNet в Tensorflow, для которого мне нужно определить пользовательский слой. При копировании модели, содержащей этот пользовательский слой, Python вызывает ошибку ValueError: Unknown layer: NoisyLayer
, Реализация слоя представлена здесь.
Цель состоит в том, чтобы скопировать одну сеть, создав ее второй экземпляр. Для этого я использую команду net_copy = copy.deepcopy(net_original)
, который работает до тех пор, пока я не включу пользовательский слой, упомянутый выше, в модель для копирования. Я видел, что для сохранения и загрузки существует способ указания пользовательских атрибутов (например, пользовательских слоев), но я не смог найти аналогичную команду, которая бы работала для copy.deepcopy()
где копия импортируется через import copy
,
Я использую Tensorflow 1.12.0 в Python3.
Опять же, пользовательский слой предоставляется по ссылке выше. Сеть, которая использует пользовательский слой, выглядит следующим образом:
class Network:
def __init__(self, actionspace_size, learning_rate, gradient_momentum, gradient_min):
frames_input = keras.layers.Input((84, 84, 4))
actions_input = keras.layers.Input((actionspace_size,))
conv1 = keras.layers.Conv2D(16, (8, 8), strides=(4, 4), activation="relu")(frames_input)
conv2 = keras.layers.Conv2D(32, (4, 4), strides=(2, 2), activation="relu")(conv1)
flattened = keras.layers.Flatten()(conv2)
# NoisyNet
hidden = NoisyLayer(activation=tf.nn.relu)(inputs=flattened, resample_noise_flag=True)
output = NoisyLayer(in_shape=(1,256), out_units=actionspace_size)(inputs=hidden, resample_noise_flag=True)
filtered_output = keras.layers.merge.Multiply()([output, actions_input])
self.model = keras.models.Model(inputs=[frames_input, actions_input], outputs=filtered_output)
self.model.compile(loss='mse', optimizer=keras.optimizers.RMSprop(lr=learning_rate, rho=gradient_momentum, epsilon=gradient_min))
При звонке
q_net = Network(actionspace_size, learning_rate, gradient_momentum, gradient_min).
target_net = copy.deepcopy(q_net)
возникает следующая ошибка:
Traceback (most recent call last):
File "DQN_tf_NoisyNet.py", line 315, in <module>
main()
File "DQN_tf_NoisyNet.py", line 252, in main
target_net = copy.deepcopy(q_net)
File "/usr/lib/python3.5/copy.py", line 182, in deepcopy
y = _reconstruct(x, rv, 1, memo)
File "/usr/lib/python3.5/copy.py", line 299, in _reconstruct
y.__setstate__(state)
File "/usr/local/lib/python3.5/dist-packages/keras/engine/network.py", line 1266, in __setstate__
model = saving.unpickle_model(state)
File "/usr/local/lib/python3.5/dist-packages/keras/engine/saving.py", line 435, in unpickle_model
return _deserialize_model(f)
File "/usr/local/lib/python3.5/dist-packages/keras/engine/saving.py", line 225, in _deserialize_model
model = model_from_config(model_config, custom_objects=custom_objects)
File "/usr/local/lib/python3.5/dist-packages/keras/engine/saving.py", line 458, in model_from_config
return deserialize(config, custom_objects=custom_objects)
File "/usr/local/lib/python3.5/dist-packages/keras/layers/__init__.py", line 55, in deserialize
printable_module_name='layer')
File "/usr/local/lib/python3.5/dist-packages/keras/utils/generic_utils.py", line 145, in deserialize_keras_object
list(custom_objects.items())))
File "/usr/local/lib/python3.5/dist-packages/keras/engine/network.py", line 1022, in from_config
process_layer(layer_data)
File "/usr/local/lib/python3.5/dist-packages/keras/engine/network.py", line 1008, in process_layer
custom_objects=custom_objects)
File "/usr/local/lib/python3.5/dist-packages/keras/layers/__init__.py", line 55, in deserialize
printable_module_name='layer')
File "/usr/local/lib/python3.5/dist-packages/keras/utils/generic_utils.py", line 138, in deserialize_keras_object
': ' + class_name)
ValueError: Unknown layer: NoisyLayer
Я знаю, что сама сеть не является проблемой (равно как и подход глубокой копии), так как оба снова работают нормально, как только я заменяю NoisyLayers (custom) стандартными плотными слоями.
Кто-нибудь знает, как скопировать модель Tensorflow, включая пользовательские слои? Заранее спасибо!
1 ответ
Нашел решение:
Проблема, опять же, заключалась в том, что Tensorflow/Keras не знали, как интерпретировать пользовательский слой. Таким образом, для предоставления информации о том, как интерпретировать слой, можно использовать CustomObjectScope
и скопируйте модель в этой области следующим образом:
# Import
import copy
from keras.utils import CustomObjectScope
# Copy
with CustomObjectScope({"MyCustomLayer":MyCustomLayer}):
model_copy = copy.deepcopy(model)
Это заботится о копировании. Тем не менее, это будет работать только из коробки, пока нет пользовательских входных данных, указанных в качестве параметров для конструктора пользовательского слоя (__init(...)
).
Я предполагаю, что это так, потому что за кулисами функция copy(), кажется, временно сохраняет, а затем снова загружает исходную модель, используя некоторые pickle
-функция или около того, так что нужно объявить значения для дальнейших параметров конструктора, а также:
Если начало пользовательского класса выглядит следующим образом, где output_dim
является одним из пользовательских параметров, указанных выше:
class MyCustomLayer(keras.layers.Layer):
def __init__(self, output_dim, **kwargs):
self.output_dim = output_dim
super(MyCustomLayer, self).__init__(**kwargs)
тогда нужно добавить функцию в класс MyCustomLayer
это также позаботится о сохранении параметров пользовательского конструктора для сохранения и загрузки (при копировании):
def get_config(self):
config = super(MyCustomLayer, self).get_config()
# Specify here all the values for the constructor's parameters
config['output_dim'] = self.output_dim
return config
Эти два шага решили проблему в моем случае.