Описание тега standardization
1
ответ
Python: объект StandardScaler не имеет атрибута _validate_data
Недавно я обновил свой sklearn. Однако после обновления я получаю сообщение об ошибке "Объект StandardScaler не имеет атрибута _validate_data". Ниже приведен фрагмент кода: Xs = pd.DataFrame([[10,20], [20,30], [30,40], [40,50]]) scalerx = preprocess…
04 июл '20 в 16:56
1
ответ
Стандартизация только числовых столбцов
У меня есть 2 функции для стандартизации моих данных, например: def standartChanger(dataFrame): stdSc = preprocessing.StandardScaler() cols = dataFrame.columns dfscaled = stdSc.fit_transform(dataFrame) dfscaled = pd.DataFrame(dfscaled, columns=cols)…
05 авг '20 в 16:51
1
ответ
StandardScaler дает неоднородное стандартное отклонение
Моя проблема заключается в следующем: Python 3.7, Pandas версии 1.0.3 и sklearn версии 0.22.1. Я обычно применяю StandardScaler (к каждому столбцу матрицы с плавающей запятой). Однако столбцы, которые я получил, не имеют стандартного отклонения =1, …
20 июн '20 в 10:56
0
ответов
Почему стандартизация данных требует большого использования памяти?
Я должен ввести в модель в качестве входных 7-канальных матриц. У них есть тип данных np.ndarray. Теперь для стандартизации матрицы я использую следующее: X_train = X_train/255 Это работает в 3-канальных матрицах, но не когда у меня есть 7-канальные…
11 июл '20 в 16:14
1
ответ
Как нормализовать данные в R
Это мои данные: a b c d e f g <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 14.6 74529 720 4639.341 10039.323 0.3089194 0.00011135818 270.0 74529 720 4639.341 10039.323 0.3089194 0.00011135818 14.6 74529 720 463…
10 авг '20 в 14:07
1
ответ
Sklearn.pipeline дает неверный результат
Я пытаюсь построить конвейер с помощью StandardScaler() и LogisticRegression(). Я получаю разные результаты, когда кодирую его с конвейером и без него. Вот мой код без конвейера: clf_LR = linear_model.LogisticRegression() scalar = StandardScaler() X…
25 авг '20 в 19:48
1
ответ
Вопрос RegEx: стандартизация медицинских терминов
Мне нужно определить слова как "бот / херсен / леверметастаза" и преобразовать их в "ботметастаза, герсенметастаза, леверметастаза". Но также "рычаг / ботметастаза" в "рычажный метастаз, ботметастаз". Поэтому мне нужно быть уверенным, что "слово / с…
02 сен '20 в 11:51
1
ответ
Как .scale_ вычисляется sklearn в Python? (Каков именно алгоритм?)
Пожалуйста, предположим, что у нас есть такой массив: import numpy as np X_train = np.array([[ 1., -1., 2.], [ 2., 0., 0.], [ 0., 1., -1.]]) Мы масштабируем это с помощью .scale_ существовал в sklearn по этому коду: from sklearn import preprocessing…
26 июн '20 в 19:34
9
ответов
Были ли когда-нибудь изменения в тихом поведении C++ с новыми стандартными версиями?
(Я ищу пару примеров, чтобы доказать свою точку зрения, а не список.) Было ли когда-нибудь изменение стандарта C++ (например, с 98 на 11, с 11 на 14 и т. Д.) Изменяло поведение существующего, правильно сформированного пользовательского кода с опреде…
06 авг '20 в 22:53
1
ответ
Как правильно использовать стандартизацию / нормализацию в сочетании с перекрестной проверкой K-Fold?
Я всегда знал, что стандартизация или нормализация должны подходить только к обучающему набору, а затем использоваться для преобразования набора тестов. Итак, что бы я сделал: scaler = StandardScaler() scaler.fit_transform(X_train) scaler.transform(…
15 окт '20 в 18:01
2
ответа
Почему C++ не стандартизировал перегрузки алгоритмов, которые работают со всеми контейнерами?
Стандартный ISO C++ имеет богатую библиотеку алгоритмов, включая множество синтаксического сахара, например std::max_element, std::fill, std::count, и т.д. Мне трудно понять, почему ISO счел нужным стандартизировать многие такие тривиальные алгоритм…
19 ноя '20 в 23:44
1
ответ
Как реализовать PySpark StandardScaler для подмножества столбцов?
Я хочу использовать pyspark StandardScaler для 6 из 10 столбцов в моем фрейме данных. Это будет частью конвейера. Кажется, что параметр inputCol ожидает вектор, который я могу передать после использования VectorAssembler для всех моих функций, но эт…
06 окт '20 в 08:04
1
ответ
Стандартизация X_train и Y_train
Я новичок в этой области и в настоящее время работаю над набором данных на основе рекламы в Facebook. Целевая переменная - диапазон потраченных средств от 10 до 200, а функции - частота (диапазон от 0,1 до 3,0) и показы (от 1000 до 30000). После обу…
26 окт '20 в 17:32
1
ответ
Результат стандартизации отличается у Patsy и Pandas - Python
Я нашел интересный вопрос и хотел бы услышать вашу интерпретацию. from patsy import dmatrix,demo_data df = pd.DataFrame(demo_data("a", "b", "x1", "x2", "y", "z column")) Patsy_Standarlize_O…
15 ноя '20 в 01:54
0
ответов
Подготовка набора данных для анализа MCA
Я хотел знать, как лучше всего подготовить набор данных для проведения анализа MCA. В частности, я хотел бы знать, должны ли все переменные в моем наборе данных быть преобразованы в 0 и 1. А если также переменные, которые являются рейтингом (наприме…
08 ноя '20 в 13:32
1
ответ
Стандартизация вектора в R, чтобы значения сдвигались к границам
У меня есть вектор следующим образом - a <- c(0.211, 0.028, 0.321, 0.072, -0.606, -0.364, -0.066, 0.172, -0.917, 0.062, 0.117, -0.136, -0.296, 0.022, 0.046, -0.19, 0.057, -0.625, -0.01, 0.158, 0.407, -0.328, -0.347, -0.512, -0.101, 0.008, -0.406,…
23 мар '21 в 00:49
0
ответов
Медианная централизация и медианная стандартизация
Я сомневаюсь, что мои образцы будут сопоставимы друг с другом. У меня есть по 3 повтора для каждой 2 группы (Тестовая и Контрольная). Я хочу посмотреть, как изменяются белки. Для этого я сначала сделал медианную централизацию для каждого столбца мое…
19 апр '21 в 21:07
1
ответ
Как стандартизировать названия городов, вставленные пользователем
Мне нужно написать небольшой конвейер ETL, потому что мне нужно переместить некоторые данные из исходной базы данных в целевую базу данных (хранилище данных), чтобы выполнить некоторый анализ данных. Среди этих данных мне нужно очистить и согласоват…
23 апр '21 в 23:05
0
ответов
нормализация значений данных поездов и тестов при прогнозировании цен на акции во временных рядах
В настоящее время я работаю над проблемой прогнозирования курса акций. У меня есть одна путаница относительно того, как нормализовать / стандартизировать данные. В общем сценарии, если мы используем библиотеку sklearn, мы создаем масштабатор и подго…
27 апр '21 в 11:26
1
ответ
Как узнать параметры StandardScaling .mean_ и .scale_ при использовании преобразователя столбцов из Scikit-learn?
Я хочу применить StandardScaler только к числовым частям моего набора данных с помощью функции sklearn.compose.ColumnTransformer, (остальное уже горячо закодировано). Я хотел бы посмотреть .scale_ а также .mean_ параметры соответствуют обучающим дан…
03 май '21 в 22:38