Циклические прогнозы с использованием разных деревьев в rpart
Я использую библиотеку rpart в R, чтобы создать серию деревьев классификации с различными вариантами максимальной глубины дерева. Моя цель - сравнить уровни ошибок деревьев, построенных с использованием этих различных глубин.
Прямо сейчас мой код разделен на две части. В первой части я использую цикл for для выращивания деревьев на разных глубинах:
for(i in 1:12) {
nam <- paste("tree", i, sep="_")
assign(nam, rpart(y ~ ., data = A, method="class", control=rpart.control(maxdepth=i, cp=0, minbucket = 1, minsplit = 2)))
}
Но затем я должен рассчитать коэффициент ошибок для каждого из этих отдельных деревьев, используя данные теста:
yhat_test_1 <- predict(tree_1, newdata = B, type = c("class"))
test_error_1 <- mean(yhat_test_1!=B[,1])
Это требует огромного объема кода, если я хочу сравнить уровни ошибок большого количества деревьев. Есть ли способ упростить этот процесс, чтобы я мог проверить частоту ошибок большого количества разных деревьев одновременно?