Добавить или вычесть значения из листьев дерева решений
Как вычесть значение из прогнозируемого значения в дереве решений моделей? я использую rpart
создать модель цен на жилье, и она производит прогнозируемую цену на каждом узле / листе:
В идеале я хотел бы выполнить эти операции:
- получить имена строк для наблюдений, которые находятся в узлах внизу
- рассчитать среднее значение, а затем вычесть среднее значение в модели. Причина в том, что я хотел бы получить разницу в фактической цене в нижних узлах, а не только в прогнозируемой цене.
Мои тренировочные данные выглядят примерно так (из соревнований Kaggle):
Id, LivingArea, GarageArea,..., SalePrice
1, 1200, 500, ..., 50 000
2, 500, 1500, ..., 150 000