Как совместить прогнозирование с тестовой рамкой
Задача слияния фрейма предсказания с объектами, содержащими h2oframe, не выполняется методом слияния water.rapids.Merge.
Как использовать метод слияния для слияния фрейма предсказания с фреймом объектов и сообщить мне описание параметров этого метода, чтобы метод мог быть вызван правильно?
merge(Frame leftFrame, Frame riteFrame, int[] leftCols, int[] riteCols, boolean allLeft, int[][] id_maps)
merge(Frame leftFrame, Frame riteFrame, int[] leftCols, int[] riteCols, boolean allLeft, int[][] id_maps, int[] ascendingL, int[] ascendingR)
что int[][] id_maps
, int[] leftCols
, int[] riteCols
параметры?
Как правильно соединить фрейм предсказания с фреймом объектов?
2 ответа
Чтобы ответить на ваш главный вопрос, используйте add()
:
val predFrame = gbmModel.predict(dataFrame)
dataAndPredFrame = dataFrame.add(predFrame)
(Бесстыдно похищен с https://github.com/h2oai/sparkling-water/issues/194)
merge()
это как SQL-соединение, и когда у вас есть два фрейма данных разных размеров; Аргументы, о которых вы спрашиваете, используются для указания того, какие столбцы в каждом из двух фреймов должны совпадать, чтобы произошло соединение.
Я не могу найти какую-либо документацию по газированной воде для этого (пожалуйста, напишите в комментариях, если кто-нибудь знает, где это!), Но вы можете понять эту идею, посмотрев документы R или Python API: http: //docs.h2o. AI / H 2 O / последний стабильный / H 2 O-документы / данные munging / слияния-data.html
Я не верю, что h2o поддерживает исходный порядок строк, как указано выше. Я использовал h2o.cbind, чтобы объединить исходный набор данных с прогнозами. Затем, сравнивая фактические значения отклика с предсказанными, я восстановил матрицу неточностей. К сожалению, он имел очень разные подсчеты, чем матрица путаницы, созданная моделью. Если строки в исходном наборе данных имели один и тот же порядок, подсчеты матрицы путаницы должны быть одинаковыми как внутри сценария R, так и снаружи.