Описание тега standardization

Описание тега Вопросы с тегом

1 ответ

Python: объект StandardScaler не имеет атрибута _validate_data

Недавно я обновил свой sklearn. Однако после обновления я получаю сообщение об ошибке "Объект StandardScaler не имеет атрибута _validate_data". Ниже приведен фрагмент кода: Xs = pd.DataFrame([[10,20], [20,30], [30,40], [40,50]]) scalerx = preprocess…

04 июл '20 в 16:56

1 ответ

Стандартизация только числовых столбцов

У меня есть 2 функции для стандартизации моих данных, например: def standartChanger(dataFrame): stdSc = preprocessing.StandardScaler() cols = dataFrame.columns dfscaled = stdSc.fit_transform(dataFrame) dfscaled = pd.DataFrame(dfscaled, columns=cols)…

python dataframe function standardization

05 авг '20 в 16:51

1 ответ

StandardScaler дает неоднородное стандартное отклонение

Моя проблема заключается в следующем: Python 3.7, Pandas версии 1.0.3 и sklearn версии 0.22.1. Я обычно применяю StandardScaler (к каждому столбцу матрицы с плавающей запятой). Однако столбцы, которые я получил, не имеют стандартного отклонения =1, …

python scikit-learn standardized standardization

20 июн '20 в 10:56

0 ответов

Почему стандартизация данных требует большого использования памяти?

Я должен ввести в модель в качестве входных 7-канальных матриц. У них есть тип данных np.ndarray. Теперь для стандартизации матрицы я использую следующее: X_train = X_train/255 Это работает в 3-канальных матрицах, но не когда у меня есть 7-канальные…

python normalization standardization

11 июл '20 в 16:14

1 ответ

Как нормализовать данные в R

Это мои данные: a b c d e f g <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 14.6 74529 720 4639.341 10039.323 0.3089194 0.00011135818 270.0 74529 720 4639.341 10039.323 0.3089194 0.00011135818 14.6 74529 720 463…

r normalization standardization

10 авг '20 в 14:07

1 ответ

Sklearn.pipeline дает неверный результат

Я пытаюсь построить конвейер с помощью StandardScaler() и LogisticRegression(). Я получаю разные результаты, когда кодирую его с конвейером и без него. Вот мой код без конвейера: clf_LR = linear_model.LogisticRegression() scalar = StandardScaler() X…

python scikit-learn pipeline logistic-regression standardization

25 авг '20 в 19:48

1 ответ

Вопрос RegEx: стандартизация медицинских терминов

Мне нужно определить слова как "бот / херсен / леверметастаза" и преобразовать их в "ботметастаза, герсенметастаза, леверметастаза". Но также "рычаг / ботметастаза" в "рычажный метастаз, ботметастаз". Поэтому мне нужно быть уверенным, что "слово / с…

regex standardization

02 сен '20 в 11:51

1 ответ

Как .scale_ вычисляется sklearn в Python? (Каков именно алгоритм?)

Пожалуйста, предположим, что у нас есть такой массив: import numpy as np X_train = np.array([[ 1., -1., 2.], [ 2., 0., 0.], [ 0., 1., -1.]]) Мы масштабируем это с помощью .scale_ существовал в sklearn по этому коду: from sklearn import preprocessing…

python-3.x scikit-learn normalization iqr standardization

26 июн '20 в 19:34

9 ответов

Были ли когда-нибудь изменения в тихом поведении C++ с новыми стандартными версиями?

(Я ищу пару примеров, чтобы доказать свою точку зрения, а не список.) Было ли когда-нибудь изменение стандарта C++ (например, с 98 на 11, с 11 на 14 и т. Д.) Изменяло поведение существующего, правильно сформированного пользовательского кода с опреде…

c++ language-lawyer standardization

06 авг '20 в 22:53

1 ответ

Как правильно использовать стандартизацию / нормализацию в сочетании с перекрестной проверкой K-Fold?

Я всегда знал, что стандартизация или нормализация должны подходить только к обучающему набору, а затем использоваться для преобразования набора тестов. Итак, что бы я сделал: scaler = StandardScaler() scaler.fit_transform(X_train) scaler.transform(…

python normalization cross-validation k-fold standardization

15 окт '20 в 18:01

2 ответа

Почему C++ не стандартизировал перегрузки алгоритмов, которые работают со всеми контейнерами?

Стандартный ISO C++ имеет богатую библиотеку алгоритмов, включая множество синтаксического сахара, например std::max_element, std::fill, std::count, и т.д. Мне трудно понять, почему ISO счел нужным стандартизировать многие такие тривиальные алгоритм…

c++ stl standardization

19 ноя '20 в 23:44

1 ответ

Как реализовать PySpark StandardScaler для подмножества столбцов?

Я хочу использовать pyspark StandardScaler для 6 из 10 столбцов в моем фрейме данных. Это будет частью конвейера. Кажется, что параметр inputCol ожидает вектор, который я могу передать после использования VectorAssembler для всех моих функций, но эт…

pyspark vector pipeline standardization feature-scaling

06 окт '20 в 08:04

1 ответ

Стандартизация X_train и Y_train

Я новичок в этой области и в настоящее время работаю над набором данных на основе рекламы в Facebook. Целевая переменная - диапазон потраченных средств от 10 до 200, а функции - частота (диапазон от 0,1 до 3,0) и показы (от 1000 до 30000). После обу…

machine-learning standardization

26 окт '20 в 17:32

1 ответ

Результат стандартизации отличается у Patsy и Pandas - Python

Я нашел интересный вопрос и хотел бы услышать вашу интерпретацию. from patsy import dmatrix,demo_data df = pd.DataFrame(demo_data("a", "b", "x1", "x2", "y", "z column")) Patsy_Standarlize_O…

python pandas data-processing patsy standardization

15 ноя '20 в 01:54

0 ответов

Подготовка набора данных для анализа MCA

Я хотел знать, как лучше всего подготовить набор данных для проведения анализа MCA. В частности, я хотел бы знать, должны ли все переменные в моем наборе данных быть преобразованы в 0 и 1. А если также переменные, которые являются рейтингом (наприме…

dataset standardization

08 ноя '20 в 13:32

1 ответ

Стандартизация вектора в R, чтобы значения сдвигались к границам

У меня есть вектор следующим образом - a <- c(0.211, 0.028, 0.321, 0.072, -0.606, -0.364, -0.066, 0.172, -0.917, 0.062, 0.117, -0.136, -0.296, 0.022, 0.046, -0.19, 0.057, -0.625, -0.01, 0.158, 0.407, -0.328, -0.347, -0.512, -0.101, 0.008, -0.406,…

r standardization

23 мар '21 в 00:49

0 ответов

Медианная централизация и медианная стандартизация

Я сомневаюсь, что мои образцы будут сопоставимы друг с другом. У меня есть по 3 повтора для каждой 2 группы (Тестовая и Контрольная). Я хочу посмотреть, как изменяются белки. Для этого я сначала сделал медианную централизацию для каждого столбца мое…

statistics normalization scaling statistical-test standardization

19 апр '21 в 21:07

1 ответ

Как стандартизировать названия городов, вставленные пользователем

Мне нужно написать небольшой конвейер ETL, потому что мне нужно переместить некоторые данные из исходной базы данных в целевую базу данных (хранилище данных), чтобы выполнить некоторый анализ данных. Среди этих данных мне нужно очистить и согласоват…

geolocation etl data-warehouse standardization

23 апр '21 в 23:05

0 ответов

нормализация значений данных поездов и тестов при прогнозировании цен на акции во временных рядах

В настоящее время я работаю над проблемой прогнозирования курса акций. У меня есть одна путаница относительно того, как нормализовать / стандартизировать данные. В общем сценарии, если мы используем библиотеку sklearn, мы создаем масштабатор и подго…

scikit-learn time-series stock normalize standardization

27 апр '21 в 11:26

1 ответ

Как узнать параметры StandardScaling .mean_ и .scale_ при использовании преобразователя столбцов из Scikit-learn?

Я хочу применить StandardScaler только к числовым частям моего набора данных с помощью функции sklearn.compose.ColumnTransformer, (остальное уже горячо закодировано). Я хотел бы посмотреть .scale_ а также .mean_ параметры соответствуют обучающим дан…

python machine-learning scikit-learn standardization

03 май '21 в 22:38