Как выбрать только лучшие функции, установив порог, используя прирост информации FSelector на языке R?
Я сделал выбор функции получения информации в R с помощью пакета FSelector в R
install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)
weights <- information.gain(Classname~., df)
Attributes attr_importance
X.1 3.6349780
X 3.6349780
Value_1 3.7128973
Value_1 0.9652070
Item_1 2.0845525
Теперь мне нужно выбрать лучшие функции из этого на основе attr_importance. Как выбрать лучшие функции в R на основе пороговых значений и как установить пороговое значение?
1 ответ
Есть метод cutoff.k
из пакета FSelector, который решает вашу проблему:
- cutoff.k выбирает k лучших атрибутов
- cutoff.k.percent выбирает лучший k * 100% атрибутов
- cutoff.biggest.diff выбирает подмножество атрибутов, которые значительно лучше, чем другие.
Например: results <- cutoff.k.percent(weights, 0.9)
вернет все атрибуты, пока не будет достигнут 0,9. Или же: results <- cutoff.k(weights, 2)
вернет 2 атрибута с наибольшим количеством информации. Это решит вашу проблему?