Использование формулы в information.gain в R
В определении функции для функции FSelector information.gain
information.gain(формула, данные)
что именно является целью формулы? Я пытаюсь использовать функцию, чтобы сделать выбор функции для задачи классификации. В тех немногих примерах, которые я видел в сети, похоже, что формула определяет какую-то связь между меткой класса и функциями в наборе данных. Однако, если это так, я не знаю точных линейных отношений между объектами и метками, так как я выполняю задачу классификации, так какой будет формула?
1 ответ
Ты можешь использовать .
сказать R, что вы хотите проанализировать зависимость между переменной класса и всеми другими переменными в фрейме данных. Например, для iris
Набор данных:
> library(FSelector)
> information.gain(Species~., iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750
Petal.Length 0.9402853
Petal.Width 0.9554360
Если вы хотите проанализировать взаимодействие только с подмножеством переменных, вы можете использовать явные имена:
> information.gain(Species~Sepal.Length+Sepal.Width, iris)
attr_importance
Sepal.Length 0.4521286
Sepal.Width 0.2672750