Использование формулы в information.gain в R

В определении функции для функции FSelector information.gain

information.gain(формула, данные)

что именно является целью формулы? Я пытаюсь использовать функцию, чтобы сделать выбор функции для задачи классификации. В тех немногих примерах, которые я видел в сети, похоже, что формула определяет какую-то связь между меткой класса и функциями в наборе данных. Однако, если это так, я не знаю точных линейных отношений между объектами и метками, так как я выполняю задачу классификации, так какой будет формула?

1 ответ

Решение

Ты можешь использовать . сказать R, что вы хотите проанализировать зависимость между переменной класса и всеми другими переменными в фрейме данных. Например, для iris Набор данных:

> library(FSelector)
> information.gain(Species~., iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750
Petal.Length       0.9402853
Petal.Width        0.9554360

Если вы хотите проанализировать взаимодействие только с подмножеством переменных, вы можете использовать явные имена:

> information.gain(Species~Sepal.Length+Sepal.Width, iris)
                attr_importance
Sepal.Length       0.4521286
Sepal.Width        0.2672750
Другие вопросы по тегам