Гамма и стоимостной параметр SVM
Всем, вот странное явление, когда я использовал libSVM, чтобы сделать некоторые прогнозы.
Когда я не установлю параметры SVM, я получу 99,9% производительности на тестовом наборе. Хотя, если я установлю параметры '-c 10 -g 5', я получу около 33% точности в тестовом наборе.
Кстати, я использую инструментарий SVM - LibSVM.
Интересно, что-то не так с набором данных? И я не мог понять, какой результат более убедителен.
1 ответ
У вас просто возникает проблема, для которой значения по умолчанию для C
а также gamma
работать хорошо (1 и 1/num_features, соответственно).
gamma=5
значительно больше значения по умолчанию. Это вполне правдоподобно для gamma=5
вызывать очень плохие результаты, когда значение по умолчанию близко к оптимальному. Сочетание больших gamma
и большой C
это идеальный рецепт для переоснащения (например, высокая производительность тренировочного комплекса и низкая производительность тестового набора).