Нужно ли определять обратную функцию для замороженных слоев?

У меня есть функциональная сеть с 4 скрытыми слоями.

Мне нужно найти подходящие веса для первого и третьего слоев, в то время как второй и четвертый уровни представляют собой некоторые виды слоев нормализации, и их не нужно изучать, поэтому я просто заморозил их, установив их скорость обучения на ноль.

Мой вопрос:

Должен ли я определить обратную функцию для этих двух замороженных слоев?

Я видел в caffe, что слой пула, который не имеет обучаемого параметра, имеет обратную функцию.

Заранее спасибо,

1 ответ

Решение

Да, вам нужен обратный проход, иначе ваше обучение остановится на этом уровне (ничто под ним не научится). Даже для непознаваемых слоев вам нужно вычислить действительные градиенты.

Другие вопросы по тегам