Как можно заменить отсутствующие значения медианой или модой в SFrame?
Я просматриваю документацию Graphlab и пытаюсь выяснить, как дублировать функциональность панд, если значения n заменяются медианой, средним значением или режимом и т. Д. В пандах вы просто делаете это с помощью: df.dropna().median() или df.dropna().mean() и т. д....
Но в документации по функциям dropna и fillna для SFrame ничего подобного не упоминается. Возможно ли это вообще в SFrame?
1 ответ
Существует один, но доступно только среднее значение, а не медиана. Посмотри на: graphlab.toolkits.feature_engineering.NumericImputer
( док)
Вменяйте пропущенные значения с помощью функциональных средств.
Входные столбцы в NumericImputer должны иметь тип int, float, dict, list или array.array. Для каждого столбца во входе преобразованный вывод является столбцом, в котором вход сохраняется как есть, если:
- нет пропущенного значения.
Входы, которые не удовлетворяют вышеуказанному, устанавливаются в среднее значение этой функции.
Если медиана это то, что вы хотите, вы можете достичь этого с помощью:
data.fillna('feature_name', np.median(data['feature_name']))