Как обеспечить стоимость балансирования обучения с помощью несбалансированного набора данных о поездах, доступную в svmlight?
Стоимость в SVM у e1071 не такая же, как у svmlight. В руководстве к библиотеке e1071 приведено следующее определение ее параметра стоимости:
cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular-
ization term in the Lagrange formulation
Это в основном допущение несоответствия классификации. Существует один вес, предоставленный svmlight, описанный в его руководстве как:
Cost: cost-factor, by which training errors on
positive examples outweight errors on negative
examples (default 1)
Эта стоимость в основном позволяет балансировать в случае, если данные поезда не имеют одинакового количества положительных и отрицательных точек данных. Есть ли что-то похожее в реализации SVM в e1071?
1 ответ
Решение
Возможно, вы захотите взглянуть на аргумент: class.weights (который объясняется на странице справки).
Лучший Дэвид