Смена модели во время тренировки [тензор потока]
Я создаю модель в тензорном потоке со всеми слоями, имеющими relu в качестве слоя активации. Однако, когда размер пакета увеличивается до 500, я хочу изменить модель так, чтобы второй последний слой для выходного слоя имел слой активации сигмовидной формы.
Что меня смущает, так это то, что мне нужно повторно инициализировать все переменные, так как я заменяю оптимизатор в середине? Или я сохраняю старые переменные?
1 ответ
Это очень интересный вопрос. Я думаю, что это зависит от ваших наборов данных и моделей.
Да: возможно, вы можете использовать веса (до размера партии 500) как предварительно обученные, как это делают Deep Belief Networks (с RBM).
Нет: возможно, эти предварительно обученные веса наносят вред вашей модели и могут быть не лучше, чем другие хорошие инициализаторы, такие как xavier initializer https://www.tensorflow.org/versions/r0.8/api_docs/python/contrib.layers.html
Я думаю, стоит попробовать оба варианта.