Есть ли функция, которая вычисляет индекс Джини для CART(алгоритм дерева решений) в R?

При использовании CART, я хотел бы выбрать основные атрибуты из целых атрибутов, используя индекс Джини.

Но я не смог найти какие-либо функции или пакеты, содержащие его.

Если есть какие-либо функции или пакеты, которые рассчитывают индекс Джини, пожалуйста, дайте мне знать.

1 ответ

Если вы подходите модели CART, используя rpart функция от library(rpart) Существует возможность указать критерии разделения в виде коэффициента Джини или статистической информации.

Синтаксис:

rpart(y~x+z, data=df, parms=list(split='gini'))

На самом деле, "Джини" по умолчанию, так что если вы просто используете rpart Функция это будет использовать коэффициент Джини в любом случае. Для получения дополнительной информации вы можете ознакомиться с введением в pdf метода и пакета здесь.

Если я неправильно понял, для чего вы используете это, и вы просто хотите функции, которые вычисляют коэффициенты Джини, вы можете посмотреть на пакет ineq, включая функцию ineq() который будет вычислять различные оценки неравенства для вас. Документация здесь.

Другие вопросы по тегам