Масштабирование функций

Question

Масштабирование функций

Я прочитал это из сообщения, в котором кто-то сказал:

Для масштабирования функций вы изучаете средние значения и стандартное отклонение обучающего набора, а затем:

Стандартизируйте обучающую выборку, используя средства обучающей выборки и стандартные отклонения.
Стандартизируйте любой набор тестов, используя средние значения обучающего набора и стандартные отклонения.

Но теперь мой вопрос: после подбора модели с использованием масштабированных обучающих данных, следует ли применять эту подогнанную модель к масштабированным или немасштабированным тестовым данным? Спасибо!

-1

python feature-scaling

Источник

user12869410 17 фев '20 в 01:45

1 ответ

Решение

Другие вопросы по тегам python feature-scaling

user11425162 17 фев '20 в 01:49 2020-02-17 01:49 · Accepted Answer · 2020-02-17 01:49

Да, вам также следует масштабировать тестовые данные. Если вы масштабировали свои обучающие данные и подогнали модель к этим масштабированным данным, то тестовый набор также должен пройти эквивалентную предварительную обработку. Это стандартная практика, поскольку она гарантирует, что в качестве входных данных модели всегда предоставляется набор данных согласованной формы.

В Python процесс может выглядеть следующим образом:

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

Подробное описание этой темы есть в другой ветке, которая может вас заинтересовать.