Предварительно обученная модель не обучается
Я использую набор данных клеток крови. Модель SSD512(предварительно обученная на наборе данных ImageNet). Обучение не дает приличной точности, иногда даже если ему удастся обучить, потеря и проверка будут равны Nan, или проверка будет равна 0. Я ранее использовал SSD300 для того же набора данных и достигал нормальных результатов. Те же настройки гиперпараметров не работают для SSD512.
ЧТО Я ПОПРОБОВАЛ
- Скорость обучения.001 или выше возвращает Нан для потери и проверки. Только.0001 или меньше, кажется, в состоянии тренировать модель.
- Я пытался использовать оптимизаторы, кроме MomentumSGD. Адам возвращает значения Нан. Другие оптимизаторы возвращают 0 проверки (ничего не изучая).
Вы можете проверить код здесь: Ссылка
Вы также можете проверить код SSD300 здесь: Ссылка
Какую настройку гиперпараметров я должен сделать здесь? Любые указатели, чтобы понять, почему SSD512 ведет себя странно на одном и том же наборе данных, будут полезны.