Прогнозирующая модель для начинающих R для 2 факторов

Я пытаюсь построить модель, которая будет предсказывать, сколько сделок будет заключено одним из наших офисов за данный месяц.

Я начал пытаться научиться создавать такую ​​модель, используя эту статью: https://medium.com/@davidsb/datascience-for-developers-build-your-first-predictive-model-with-r-a798f684752f

Тем не менее, похоже, что модель, которую они строят, рассчитана на 1 фактор. В идеале я бы хотел иметь возможность выбрать month = January, office = Atlanta и результатом будет оценка количества сделок, которые офис Атланты может ожидать в январе.

Мой набор данных организован следующим образом:

Office   DealMonth   DealYear   CountDeals 
Atlanta  1           2015       10
Atlanta  2           2016       35

Есть ли простой способ настроить базовую модель, изложенную в статье, чтобы получить желаемый результат?

Изменить: код, как он стоит ниже:

dat = read.csv("RawDataDealCountSummary.csv")
head(dat)

str(dat)

dat$DealMonth = factor(dat$DealMonth)

train_data = dat[dat$DealYear<2017,]
test_data = dat[dat$DealYear == 2017,]

head(train_data)
head(test_data)

test_counts <- test_data$DealCount

plot(dat$ï..DealOffice, dat$DealCount)

model=rpart(DealCount ~ ï..DealOffice + DealMonth, train_data,)

p = predict(model, test_data)
plot(p - test_counts)

predict(model, data.frame(ï..DealOffice = factor('Atlanta'), DealMonth = factor(12)))

0 ответов

Другие вопросы по тегам