Оптимизатор MXNet AdamW

Оптимизатор Адама имеет недостатки при использовании со снижением веса. В 2018 году был предложен оптимизатор AdamW.

Есть ли стандартный способ реализовать AdamW в структуре MXNet (реализация на Python)? Там естьmxnet.optimizer.Adam класс, но нет mxnet.optimizer.AdamW один (зарегистрировался mxnet-cu102==1.6.0, mxnet==1.5.0 версии пакета).

PS Я задавал эти вопросы на форуме MXNet и на datascience.stackexchange.com, но безрезультатно.

1 ответ

Краткий ответ: пока нет стандартного способа использования AdamW в Gluon, но есть некоторые работы в этом направлении, которые позволили бы относительно легко добавить его.

Более длинный ответ:

Пожалуйста, дайте мне знать, если у вас это сработает, так как я бы тоже хотел иметь возможность использовать это.

Другие вопросы по тегам