rxDForest в файле xdf

У меня есть.xdf файл "Поезд" и "Тест". Я пытаюсь смоделировать деревья регрессии с помощью функции rxDForest, однако, когда я включаю категориальную переменную country_id который имеет 49 уровней, как предиктор, функция просто не завершается, и мне нужно завершить сеанс. То же самое хорошо работает без категориальной переменной.

Ниже приведена команда:

# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~  Report.Month + fecal_coliform_value  +  Yrs_Exist + country_id.f
                       , data = 'water_point.splitVar.Train.xdf' 
                       , maxUnorderedLevels = 50 
                       , maxDepth = 10, mTry = 2 , nTree = 2)

Прочитанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,043 секунды

Прочитанные строки: 107443, Всего обработанных строк: 107443, Общее время порции: 0,049 секунды

Функция не завершает выполнение после двух вышеуказанных сообщений. Вот:

  • status.f является фактор-переменной со значениями "Да" или "Нет"
  • country_id.f фактор-переменная с 49 уровнями; а также
  • остальные переменные являются числовыми.

У меня проблема с файлом.xdf. Та же команда на dataframe работает хорошо.

Можно предложения, пожалуйста? Спасибо

0 ответов

Другие вопросы по тегам