Как рассчитывается MeanGiniDecrease для каждой функции в пакете randomForest?

При моем понимании, что уменьшение Джини может быть вычислено простым способом путем вычитания примеси Джини дочерних узлов из родительского узла, как все вычисления агрегируются по элементу в лесу?

Например, я видел много графиков MeanGiniDecrease, которые показывают значения более 100 для некоторых функций. Кажется нереалистичным (или, может быть, это не??), что суммирование всех уменьшений на узлах, относящихся к данной функции (все значения от 0 до 1) для данного дерева, привело бы к таким большим числам.

Любая помощь будет принята с благодарностью!

0 ответов

Другие вопросы по тегам