Предварительно обученная модель не обучается

Я использую набор данных клеток крови. Модель SSD512(предварительно обученная на наборе данных ImageNet). Обучение не дает приличной точности, иногда даже если ему удастся обучить, потеря и проверка будут равны Nan, или проверка будет равна 0. Я ранее использовал SSD300 для того же набора данных и достигал нормальных результатов. Те же настройки гиперпараметров не работают для SSD512.

ЧТО Я ПОПРОБОВАЛ

  1. Скорость обучения.001 или выше возвращает Нан для потери и проверки. Только.0001 или меньше, кажется, в состоянии тренировать модель.
  2. Я пытался использовать оптимизаторы, кроме MomentumSGD. Адам возвращает значения Нан. Другие оптимизаторы возвращают 0 проверки (ничего не изучая).

Вы можете проверить код здесь: Ссылка

Вы также можете проверить код SSD300 здесь: Ссылка

Какую настройку гиперпараметров я должен сделать здесь? Любые указатели, чтобы понять, почему SSD512 ведет себя странно на одном и том же наборе данных, будут полезны.

0 ответов

Другие вопросы по тегам