Циклические прогнозы с использованием разных деревьев в rpart

Я использую библиотеку rpart в R, чтобы создать серию деревьев классификации с различными вариантами максимальной глубины дерева. Моя цель - сравнить уровни ошибок деревьев, построенных с использованием этих различных глубин.

Прямо сейчас мой код разделен на две части. В первой части я использую цикл for для выращивания деревьев на разных глубинах:

for(i in 1:12) {
  nam <- paste("tree", i, sep="_")
  assign(nam, rpart(y ~ ., data = A, method="class", control=rpart.control(maxdepth=i, cp=0, minbucket = 1, minsplit = 2)))
}

Но затем я должен рассчитать коэффициент ошибок для каждого из этих отдельных деревьев, используя данные теста:

yhat_test_1 <- predict(tree_1, newdata = B, type = c("class"))
test_error_1 <- mean(yhat_test_1!=B[,1])

Это требует огромного объема кода, если я хочу сравнить уровни ошибок большого количества деревьев. Есть ли способ упростить этот процесс, чтобы я мог проверить частоту ошибок большого количества разных деревьев одновременно?

0 ответов

Другие вопросы по тегам