Как рассчитывается MeanGiniDecrease для каждой функции в пакете randomForest?
При моем понимании, что уменьшение Джини может быть вычислено простым способом путем вычитания примеси Джини дочерних узлов из родительского узла, как все вычисления агрегируются по элементу в лесу?
Например, я видел много графиков MeanGiniDecrease, которые показывают значения более 100 для некоторых функций. Кажется нереалистичным (или, может быть, это не??), что суммирование всех уменьшений на узлах, относящихся к данной функции (все значения от 0 до 1) для данного дерева, привело бы к таким большим числам.
Любая помощь будет принята с благодарностью!