При выполнении классификации в R, как рассчитать прирост информации для каждой переменной?
Я понимаю, что получение информации - это в основном энтропия родительского узла минус энтропия дочерних узлов, а в R есть такие функции, как gains(actual_prob,predict_prob,groups=10)
который дает график усиления и подъема, но это для всей модели. Как я могу получить усиление или энтропию только одной из переменных?
Это таблица результатов прироста:
> print(fit1.gain)
Depth Cume Cume Pct Mean
of Cume Mean Mean of Total Lift Cume Model
File N N Resp Resp Resp Index Lift Score
-------------------------------------------------------------------------
10 2398 2398 0.42 0.42 100.0% 996 996 0.28
20 2389 4787 0.00 0.21 100.0% 0 499 0.05
30 2381 7168 0.00 0.14 100.0% 0 333 0.04
40 2391 9559 0.00 0.11 100.0% 0 250 0.03
50 2389 11948 0.00 0.08 100.0% 0 200 0.02
60 2393 14341 0.00 0.07 100.0% 0 167 0.02
70 2386 16727 0.00 0.06 100.0% 0 143 0.01
80 2390 19117 0.00 0.05 100.0% 0 125 0.01
90 2389 21506 0.00 0.05 100.0% 0 111 0.00
100 2390 23896 0.00 0.04 100.0% 0 100 -0.00