Можем ли мы импортировать модель случайного леса, построенную с использованием SparkR, в R, а затем использовать getTree для извлечения одного из деревьев?
Как в дереве решений мы можем видеть или визуализировать разбиения узлов, я хочу сделать что-то подобное. Но я использую SparkR, и у него нет деревьев решений. Поэтому я планирую использовать случайный лес с 1 деревом в качестве параметра и запускать на SparkR, затем сохранить модель и использовать getTree, чтобы увидеть разбиения узла и далее визуализировать с помощью ggplot.
1 ответ
Краткий ответ - нет.
Модели, созданные с помощью SparkR, не совместимы с моделями, созданными с соответствующими пакетами R, в этом случае randomForest
; следовательно, вы не сможете использовать getTree
Функция последнего позволяет визуализировать дерево из случайного леса, созданного с помощью SparkR.
На другом уровне: я удивлен, что деревья решений до сих пор не нашли свой путь в SparkR - они, кажется, готовы уже несколько месяцев назад в репозитории Github; но даже если они есть, от них не ожидается, что они будут предлагать методы для визуализации деревьев, и вы все равно не сможете использовать для этой цели функции из других пакетов R.