Добавить или вычесть значения из листьев дерева решений

Как вычесть значение из прогнозируемого значения в дереве решений моделей? я использую rpart создать модель цен на жилье, и она производит прогнозируемую цену на каждом узле / листе:

Цены на жилье

В идеале я хотел бы выполнить эти операции:

  1. получить имена строк для наблюдений, которые находятся в узлах внизу
  2. рассчитать среднее значение, а затем вычесть среднее значение в модели. Причина в том, что я хотел бы получить разницу в фактической цене в нижних узлах, а не только в прогнозируемой цене.

Мои тренировочные данные выглядят примерно так (из соревнований Kaggle):

Id, LivingArea, GarageArea,..., SalePrice  
1, 1200, 500, ..., 50 000  
2, 500, 1500, ..., 150 000

0 ответов

Другие вопросы по тегам