Есть ли функция, которая вычисляет индекс Джини для CART(алгоритм дерева решений) в R?
При использовании CART, я хотел бы выбрать основные атрибуты из целых атрибутов, используя индекс Джини.
Но я не смог найти какие-либо функции или пакеты, содержащие его.
Если есть какие-либо функции или пакеты, которые рассчитывают индекс Джини, пожалуйста, дайте мне знать.
1 ответ
Если вы подходите модели CART, используя rpart
функция от library(rpart)
Существует возможность указать критерии разделения в виде коэффициента Джини или статистической информации.
Синтаксис:
rpart(y~x+z, data=df, parms=list(split='gini'))
На самом деле, "Джини" по умолчанию, так что если вы просто используете rpart
Функция это будет использовать коэффициент Джини в любом случае. Для получения дополнительной информации вы можете ознакомиться с введением в pdf метода и пакета здесь.
Если я неправильно понял, для чего вы используете это, и вы просто хотите функции, которые вычисляют коэффициенты Джини, вы можете посмотреть на пакет ineq
, включая функцию ineq()
который будет вычислять различные оценки неравенства для вас. Документация здесь.