Как установить срез при обучении данных в Random Forest в Spark

Question

Как установить срез при обучении данных в Random Forest в Spark

Я использую Spark Mlib для обучения данных для классификации с использованием алгоритма случайного леса. MLib предоставляет класс Random Forest, у которого есть метод trainClassifier, который выполняет требуемое.

Могу ли я установить пороговое значение во время тренировки набора данных, аналогично опции отсечения, предоставленной в пакете randomForest R.

http://cran.r-project.org/web/packages/randomForest/randomForest.pdf

Я обнаружил, что класс Random Forest MLib предоставляет опции только для передачи количества деревьев, примесей, количества классов и т. Д., Но нет ничего подобного пороговому или отсеченному варианту. Это может быть сделано любым способом.

0

apache-spark random-forest apache-spark-mllib

Источник

user4052941 01 июн '15 в 08:47

1 ответ

Решение

Другие вопросы по тегам apache-spark random-forest apache-spark-mllib

user572083 03 июн '15 в 06:57 2015-06-03 06:57 · Accepted Answer · 2015-06-03 06:57

Короткая версия нет, если мы посмотрим на RandomForestClassifier.scala Вы можете видеть, что он всегда просто выбирает макс. Вы можете переопределить функцию предсказания, если, но она не супер чистая. Я добавил джира, чтобы отслеживать добавление этого.

0

Источник

user572083 03 июн '15 в 06:57