Гамма и стоимостной параметр SVM

Всем, вот странное явление, когда я использовал libSVM, чтобы сделать некоторые прогнозы.

Когда я не установлю параметры SVM, я получу 99,9% производительности на тестовом наборе. Хотя, если я установлю параметры '-c 10 -g 5', я получу около 33% точности в тестовом наборе.

Кстати, я использую инструментарий SVM - LibSVM.

Интересно, что-то не так с набором данных? И я не мог понять, какой результат более убедителен.

1 ответ

Решение

У вас просто возникает проблема, для которой значения по умолчанию для C а также gamma работать хорошо (1 и 1/num_features, соответственно).

gamma=5 значительно больше значения по умолчанию. Это вполне правдоподобно для gamma=5 вызывать очень плохие результаты, когда значение по умолчанию близко к оптимальному. Сочетание больших gamma и большой C это идеальный рецепт для переоснащения (например, высокая производительность тренировочного комплекса и низкая производительность тестового набора).

Другие вопросы по тегам