rxDForest в файле xdf
У меня есть.xdf файл "Поезд" и "Тест". Я пытаюсь смоделировать деревья регрессии с помощью функции rxDForest, однако, когда я включаю категориальную переменную country_id
который имеет 49 уровней, как предиктор, функция просто не завершается, и мне нужно завершить сеанс. То же самое хорошо работает без категориальной переменной.
Ниже приведена команда:
# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~ Report.Month + fecal_coliform_value + Yrs_Exist + country_id.f
, data = 'water_point.splitVar.Train.xdf'
, maxUnorderedLevels = 50
, maxDepth = 10, mTry = 2 , nTree = 2)
Прочитанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,043 секунды
Прочитанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,049 секунды
Функция не завершает выполнение после двух вышеуказанных сообщений. Вот:
status.f
является фактор-переменной со значениями "Да" или "Нет"country_id.f
фактор-переменная с 49 уровнями; а также- остальные переменные являются числовыми.
У меня проблема с файлом.xdf. Та же команда на dataframe
работает хорошо.
Можно предложения, пожалуйста? Спасибо