Как узнать параметры StandardScaling .mean_ и .scale_ при использовании преобразователя столбцов из Scikit-learn?
Я хочу применить StandardScaler только к числовым частям моего набора данных с помощью функции
sklearn.compose.ColumnTransformer
, (остальное уже горячо закодировано). Я хотел бы посмотреть
.scale_
а также
.mean_
параметры соответствуют обучающим данным, но функция
scaler.mean_
а также
scaler.scale_
очевидно не работает при использовании трансформатора колонки. Как это сделать?
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)
scaler = StandardScaler()
data_pipeline = ColumnTransformer([
('numerical', scaler, numerical_variables)], remainder='passthrough')
X_train = data_pipeline.fit_transform(X_train)
1 ответ
Установленные трансформаторы доступны в атрибутах
transformers_
(список) и
named_transformers_
(dict-подобный ключ с указанными вами именами). Так, например,
data_pipeline.named_transformers_['numerical'].mean_