Получите мгновенно закодированный H2OFrame
Я использую xgboost в H2O для задачи двоичной классификации. Набор данных имеет несколько категориальных функций, к которым модель применяет быстрое кодирование во время обучения.
Теперь я хочу использовать SHAP (https://github.com/slundberg/shap) для локальной интерпретации прогнозов. Для этого было бы неплохо иметь фрейм данных с горячими закодированными столбцами и значениями. Однако я, похоже, не нахожу способа получить это от модели H2O.
Я, вероятно, мог бы вручную воссоздать горячую кодировку, но, может быть, кто-то знает более быстрое решение?
1 ответ
У нас есть билет на это некоторое время, но мы скоро вернемся к нему из-за повышенного спроса на эту функцию. На данный момент вам нужно будет преобразовать ваш H2OFrame в Pandas DataFrame, используя as_data_frame()
метод, а затем примените одно из следующих решений.