Описание тега overfitting-underfitting

0 ответов

найти переоснащение в тензорной доске для обнаружения объектов

Я пытаюсь обучить EfficientDet-D0 с 500 изображениями 300 × 300 с API обнаружения объектов тензорного потока. Я выполняю задачу на виртуальной машине Azure с двумя графическими процессорами P40 серии N. Я вижу большие колебания моих оценочных показа…
1 ответ

Как справиться с чрезмерной подгонкой в ​​моделях CNN на основе НЛП для мультиклассовой классификации текста с встраиваниями слов?

(Проблема: проблемы с переоснащением в проблеме классификации мультиклассового текста) В моем личном проекте целью является классификация отраслевых тегов компании на основе описания компании. Я предпринял следующие шаги: Удаление игнорируемых слов,…
0 ответов

Потеря валидации непоследовательна

У меня есть модель глубокого обучения с подписью к изображениям, она не обучается должным образом. Не знаю, в чем проблема. Я использую кодировщик CNN, BiLSTM-Attention Decoder. Еще я тренировался 100 эпох и т.д., это не улучшило результатов. Показа…
0 ответов

Это перебор с данными обучения 14 КБ и данными проверки 4,7 КБ при создании текста GPT2? [закрыто]

Я пытаюсь разработать модель генерации текста с использованием GPT2. Подскажите, пожалуйста, не слишком ли она подходит. График потерь набора для обучения и проверки прилагается.
0 ответов

Некоторые регрессионные модели плохо работают на обучающей выборке и хорошо работают на невидимых данных.

Я использую разные регрессионные модели для решения проблемы регрессии. Проблема в том, что показатели производительности очень высоки на тестовом наборе (train_test_split). Вот значения: MAE: 2.5001127258479676 MSE: 8.917729026153863 RMSE:2.9862566…
1 ответ

Как улучшить производительность CNN и уменьшить переобучение?

Я работаю над небольшим проектом компьютерного зрения и использую сверточные сети для классификации. Я уже использовал выпадение, регуляризацию l1, l2 и увеличение данных, чтобы уменьшить переобучение. Существуют ли какие-либо другие методы и алгори…
0 ответов

как это называется, когда моя модель подгоняется под одну конкретную функцию?

Я работал над проблемой регрессии, которая включает анализ табличных данных. Я тренировал много разных моделей, и есть одна особенность, которой эта модель больше всего подходит. т. е. модель хорошо сходится с целью, когда она видит изменения в этой…
0 ответов

Регрессия с CNN - перекрытие изображений и утечка данных [закрыто]

Я использую изображения для выполнения регрессии с CNN. Проблема в том, что исходный набор данных очень мал. Поэтому я использовал перекрытие 96%, чтобы получить больше данных (от 250 до 2467 точек данных). Это приводит к проблемам при разделении на…
0 ответов

точность проверки ниже, чем точность поезда

Основываясь на этих графиках, можно ли сказать, что это переоснащение? Если да, то каковы методы решения этой проблемы?
1 ответ

Как проверить переоснащение при перекрестной проверке регрессии с помощью GridSearchCV?

Я использую регрессионную модель набора непрерывных переменных и непрерывной цели. Это мой код: def run_RandomForest(xTrain,yTrain,xTest,yTest): cv = RepeatedKFold(n_splits=10, n_repeats=3, random_state=1) # define the pipeline to evaluate model = R…
2 ответа

Потеря валидации возрастает после некоторого переходного обучения эпохи

Мои потери проверки уменьшаются с хорошей скоростью в течение первых 50 эпох, но после этого потеря проверки перестает уменьшаться в течение десяти эпох после этого. Я использую мобильную сеть, замораживаю слои и добавляю собственную голову. моя кас…
1 ответ

Хорошая точность, плохой прогноз

Я пытаюсь сделать проект классификации нескольких классов с CNN. Моя проблема заключается в получении хорошей точности, но при плохом прогнозировании данных проверки. Я ввел регуляризацию l2, но она плохо обобщает. Также пробовал с разными значениям…
0 ответов

Переоснащение фильтра Калмана с помощью pykalman 2d

Я использую сглаживание калмана, чтобы оценить путь человека на основе точек GPS. Некоторое время назад у меня был вопрос, на который здесь был дан очень хороший ответ : kalman filter 2dwithpykalman . Однако теперь у меня есть проблема, что фильтр К…
1 ответ

как предотвратить переобучение в усиленном обучении с помощью vgg16

Я пытаюсь обучить модель распознавать выражения лица, поэтому в основном проблема классификации с 7 классами: img_size=48 batch_size=64 datagen_train=ImageDataGenerator( rotation_range=15, width_shift_range=0.15, height_shift_range=0.15, shear_range…
0 ответов

Как проверить, переоснащена ли модель?

Как проверить, переоснащается ли модель, какие параметры следует учитывать для ранней остановки, если мы хотим, чтобы модель не переобучалась. В настоящее время я использую потерю проверки для ранней остановки. ##For Adam model = getNewModel() model…
1 ответ

Собственные наборы данных Siamese Network-Train и оценены как переоснащение

Я использую Siamese Network для обучения собственному набору данных. Я визуализировал результаты обучения с помощью Tensorboard. Я новичок и не очень хорошо умею судить, является ли это перебором. Пожалуйста, помогите увидеть, спасибо! На рисунках 1…
0 ответов

Потеря валидации всегда ниже, чем потеря обучения, независимо от всех внесенных изменений? [закрыто]

Я знаю, что об этом спрашивали здесь слишком много раз, но независимо от того, что я делаю, потери в обучении выше, чем потери при проверке. Я сделал все возможное, например, выпадение, увеличение и т. Д. И даже изменил архитектуру, но проблема та ж…
1 ответ

Если проверка не сходится, моя модель переоснащается, верно?

У меня есть этот график, и мои потери при проверке не сходятся. я прав, что это случай переобучения? графическое изображение
0 ответов

Подходит ли эта модель CNN?

Я новичок в глубоком обучении и буду благодарен за любую помощь. Я создал модель трансферного обучения с использованием сети VGG16. Пока я выполнил 35 эпох. Ниже приведены результаты: Я построил график тренировок и потерь при проверке, и вот результ…
0 ответов

Обучение CNN на Matlab дает разные результаты по сравнению с обучением той же сети на python с использованием keras

Я использую Keras для обучения сети для решения проблемы классификации на python, модель, которую я использую, выглядит следующим образом: filter_size = (2,2) maxpool_size = (2, 2) dr = 0.5 inputs = Input((12,8,1), name='main_input') main_branch = C…