Как быстро проверить новую конфигурацию или новую настройку гиперпараметра модели CNN для большого набора данных изображения (например, imagenet)

Я новичок в разработке модели CNN с использованием tenorflow, и у меня есть вопрос:

Когда я разрабатываю новую конфигурацию модели CNN (для обнаружения, распознавания, суперразрешения и т. Д.), Мне всегда нужно точно настраивать конфигурацию (количество слоев или количество фильтров в каждом слое) и гиперпараметры. (weghtdecay, max steps...) для нескольких наборов данных.

Возьмем, к примеру, Densenet: при точной настройке гиперпараметров для небольших наборов данных изображений, таких как CIFAR10, время обучения варьируется от 6 часов (что приемлемо) до более двух дней (что немного, но все еще в порядке), что приемлемо.

Но при обучении на больших наборах данных, таких как ImageNet, для завершения обучения может потребоваться две недели, а это значит, что я могу настраивать модель только каждые две недели.

Это не эффективность. Если я хочу подстроить конфигурацию и настройки гипараметра модели CNN в наборе данных большого изображения, есть ли какой-нибудь метод обучения эффективности, чтобы сделать это, не занимая так много времени?

0 ответов

Другие вопросы по тегам