Как выбрать только лучшие функции, установив порог, используя прирост информации FSelector на языке R?

Я сделал выбор функции получения информации в R с помощью пакета FSelector в R

install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)

weights <- information.gain(Classname~., df)

Attributes                                          attr_importance
X.1                                              3.6349780
X                                                3.6349780
Value_1                                          3.7128973
Value_1                                          0.9652070
Item_1                                           2.0845525

Теперь мне нужно выбрать лучшие функции из этого на основе attr_importance. Как выбрать лучшие функции в R на основе пороговых значений и как установить пороговое значение?

1 ответ

Есть метод cutoff.k из пакета FSelector, который решает вашу проблему:

  • cutoff.k выбирает k лучших атрибутов
  • cutoff.k.percent выбирает лучший k * 100% атрибутов
  • cutoff.biggest.diff выбирает подмножество атрибутов, которые значительно лучше, чем другие.

Например: results <- cutoff.k.percent(weights, 0.9) вернет все атрибуты, пока не будет достигнут 0,9. Или же: results <- cutoff.k(weights, 2) вернет 2 атрибута с наибольшим количеством информации. Это решит вашу проблему?

Другие вопросы по тегам