Как обеспечить стоимость балансирования обучения с помощью несбалансированного набора данных о поездах, доступную в svmlight?

Стоимость в SVM у e1071 не такая же, как у svmlight. В руководстве к библиотеке e1071 приведено следующее определение ее параметра стоимости:

cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular-
ization term in the Lagrange formulation

Это в основном допущение несоответствия классификации. Существует один вес, предоставленный svmlight, описанный в его руководстве как:

Cost: cost-factor, by which training errors on
      positive examples outweight errors on negative
      examples (default 1)

Эта стоимость в основном позволяет балансировать в случае, если данные поезда не имеют одинакового количества положительных и отрицательных точек данных. Есть ли что-то похожее в реализации SVM в e1071?

1 ответ

Решение

Возможно, вы захотите взглянуть на аргумент: class.weights (который объясняется на странице справки).

Лучший Дэвид

Другие вопросы по тегам