Как совместить прогнозирование с тестовой рамкой

Задача слияния фрейма предсказания с объектами, содержащими h2oframe, не выполняется методом слияния water.rapids.Merge.

Как использовать метод слияния для слияния фрейма предсказания с фреймом объектов и сообщить мне описание параметров этого метода, чтобы метод мог быть вызван правильно?

merge(Frame leftFrame, Frame riteFrame, int[] leftCols, int[] riteCols, boolean allLeft, int[][] id_maps) 

merge(Frame leftFrame, Frame riteFrame, int[] leftCols, int[] riteCols, boolean allLeft, int[][] id_maps, int[] ascendingL, int[] ascendingR) 

что int[][] id_maps, int[] leftCols, int[] riteCols параметры?

Как правильно соединить фрейм предсказания с фреймом объектов?

2 ответа

Чтобы ответить на ваш главный вопрос, используйте add():

val predFrame = gbmModel.predict(dataFrame)
dataAndPredFrame = dataFrame.add(predFrame)

(Бесстыдно похищен с https://github.com/h2oai/sparkling-water/issues/194)

merge() это как SQL-соединение, и когда у вас есть два фрейма данных разных размеров; Аргументы, о которых вы спрашиваете, используются для указания того, какие столбцы в каждом из двух фреймов должны совпадать, чтобы произошло соединение.

Я не могу найти какую-либо документацию по газированной воде для этого (пожалуйста, напишите в комментариях, если кто-нибудь знает, где это!), Но вы можете понять эту идею, посмотрев документы R или Python API: http: //docs.h2o. AI / H 2 O / последний стабильный / H 2 O-документы / данные munging / слияния-data.html

Я не верю, что h2o поддерживает исходный порядок строк, как указано выше. Я использовал h2o.cbind, чтобы объединить исходный набор данных с прогнозами. Затем, сравнивая фактические значения отклика с предсказанными, я восстановил матрицу неточностей. К сожалению, он имел очень разные подсчеты, чем матрица путаницы, созданная моделью. Если строки в исходном наборе данных имели один и тот же порядок, подсчеты матрицы путаницы должны быть одинаковыми как внутри сценария R, так и снаружи.

Другие вопросы по тегам