Какова интерпретация полей графика результатов дерева логистической модели (LMT) в пакете RWeka в r?
Я работаю над пользовательской классификацией с 5 известными группами (наблюдения примерно поровну разделены по группам). У меня есть информация об этих пользователях (например, возраст, жилая площадь...) и я пытаюсь найти характеристики, которые идентифицируют пользователей в каждой группе.
Для этого я использую пакет Rweka в R (коллекция алгоритмов машинного обучения: http://cran.r-project.org/web/packages/RWeka/RWeka.pdf). Чтобы найти характеристики, которые различают мои группы, я использую Деревья логистических моделей (LMT). Об этой функции мало информации:
- Я постараюсь набросать пример построенного дерева. Разделения являются прямыми для интерпретации, но в каждом терминальном узле есть поле, заполненное:
LM_24: 48/96
(20742)
Что это значит? Как узнать, в какой из пяти групп заканчивается узел?
- С помощью какой функции я могу получить коэффициенты, используемые в модели? Так что влияние переменных можно изучить.
(Я изучал другие методы построения деревьев на этих данных, но пакеты регрессии и дерева классификации (например, rpart, party) находят только одну конечную ноту в моих данных, тогда как функция LMT находит 6 узлов разделения)
Я надеюсь, что вы можете предоставить мне ответ / некоторую помощь с этой функцией. Большое спасибо!