Оценка сигма для ядра rbf-SVM
Я работаю на сервере пакетов MSVM для классификации с использованием ядра rbf.
В этом пакете можно изменить параметр сигмы (также известный как bandwidth
в машинном обучении, и он равен (1/gamma)
) для ядра rbf. Читая документацию этого пакета, я нашел это sigma = sqrt(5*dim(X))
Также по документации scikit-learn
Я нашел другую близкую формулу sigma= 1\(number of features for x
) где количество элементов совпадает с размером х.
Мой вопрос
Хотя понятно, как изменение сигмы может повлиять на классификацию, но я не могу понять связь между измерением данных (количество признаков) и сигмой, и на практике, как изменение количества признаков влияет на сигму и, таким образом, влияет процедура классификации.
К сожалению, я не нашел ответа в теории, кроме формул, которые я представил выше, поэтому я хотел бы найти ответ на практике.
Кроме того, я был бы очень благодарен, если бы кто-то направил меня к ссылке, доказывающей формулы, представленные выше, и разъясняющей связь между сигмой и измерением.
Примечание: я знаю, что существуют другие способы оценки сигмы, но мне интересно узнать больше о представленной.
Большое спасибо.