Какова размерность весов ворот блока ГРУ?

Я внедряю нейронную сеть в Lasagne, где я хотел бы поделиться весами между различными слоями GRU ( http://lasagne.readthedocs.io/en/latest/modules/layers/recurrent.html). Чтобы сделать это, я заменяю ворота сброса, обновления и скрытого обновления слоев GRU пользовательскими воротами ( http://lasagne.readthedocs.io/en/latest/modules/layers/recurrent.html).

В этих воротах я должен определить веса от входа до шлюза W_in и веса от скрытия до ворот W_hid. Какой должна быть размерность этих весов? Моим лучшим предположением будет то, что для входных данных с размерностью batch_size x input_len x num_features, dim(W_in) = num_features x num_hidden и dim(W_hid) = num_hidden x num_hidden. Однако это не работает.

У кого-нибудь есть идея? Заранее спасибо!

0 ответов

Другие вопросы по тегам