RWeka Дискретизировать результаты
Я пытаюсь дискретизировать набор данных, используя RWeka Discretize
фильтр. Мой набор данных начинается с более миллиона записей, но возвращенный набор имеет только около 100 тыс. Записей. Функция выглядит так, как будто она должна возвращать ячейки на запись в наборе, так что мне интересно, куда ушли 90% моих данных?
В данных есть NA, поэтому я попробовал и получил следующее:
> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space
Я работаю над чужим кодом, и, похоже, раньше это не было проблемой. Я не уверен, является ли это недостаточным пониманием дискретизации или R. Может кто-нибудь объяснить, как Discretize
должен работать и что происходит?