Описание тега label-encoding
Кодирование меток относится к преобразованию категориальных меток в наборе данных, используемом для целей машинного обучения, в числовую форму. Затем алгоритмы машинного обучения могут лучше решить, как эти метки должны работать. Это важный этап предварительной обработки набора структурированных данных в контролируемом обучении.
3
ответа
Как применить LabelEncoder для определенного столбца в кадре данных Pandas
У меня есть набор данных, загруженный в dataframe, где метка класса должна быть закодирована с использованием LabelEncoder из scikit-учиться. Колонка label столбец метки класса, который имеет следующие классы: [‘Standing’, ‘Walking’, ‘Running’, ‘nul…
09 май '18 в 17:26
0
ответов
get_dummies или кодировка меток, которая лучше подходит для преобразования категориальных переменных
Что лучше, get_dummies или кодировка меток? Для категориальных переменных. Пожалуйста, предлагайте на высоком уровне. Я новичок в аналитике.
09 июн '20 в 02:52
1
ответ
При сопоставлении словаря внутри серии для маркировки категориальных значений, получающих выходную серию во всех нулевых
zipcode =[str(x) for x in zipcode] label = list(range(len(zipcode))) directory = {} for i in label: directory[zipcode[i]] = i data['zipcode']=data['zipcode'].map(directory) [t][1] После приведенного выше кода я получаю целые столбцы как Null значен…
22 авг '20 в 11:17
1
ответ
LabelEncoder не может выполнить обратное преобразование (невидимые метки) после подстановки пропущенных значений
Я нахожусь на уровне от новичка до среднего уровня науки о данных. Я хочу вменять отсутствующие значения из фрейма данных, используяknn. Поскольку фрейм данных содержит строки и floats, Мне нужно кодировать / декодировать значения, используя LabelEn…
31 янв '20 в 17:37
2
ответа
Для цикла в кодировке меток и одного горячего кодировщика
Мой набор данных содержит категориальные переменные, поэтому я использую кодировку меток и один горячий кодировщик, и мой код выглядит следующим образом могу ли я использовать цикл, чтобы убедиться, что мой код состоит из меньших строк кода? from sk…
02 мар '20 в 11:34
2
ответа
Аргумент должен быть строкой или числом [Кодировка метки]
Я пытаюсь добавить свой фрейм данных в новый фрейм данных, но получаю ошибку "Аргумент должен быть строкой или числом". # The encoders le = LabelEncoder() ohc = OneHotEncoder() for col in num_ohc_cols.index: # Integer encode the string categories da…
30 май '20 в 02:09
0
ответов
Параметр OneHotEncoder: Категории
Я программировал на ML через Scikit-learn несколько месяцев. но появилось обновление для объекта предварительной обработки scikit, которым является OneHotEncoder. здесь был параметр ategorical_features, который теперь изменен на категории, и теперь …
04 фев '20 в 21:18
0
ответов
Как пометить различные комбинации значений столбцов?
У меня есть данные как: Purchase_own Purchase_any count 0 0 16070650 1 768242 1 1 81103 Я хочу выводить как: Purchase_own Purchase_any code_label решение 0 0 0 no_purchase 0 1 1 Purchase_any 1 1 2 Purchase_own
23 июн '20 в 20:01
2
ответа
Разница между порядковыми и категориальными данными как метками в scikit learn
Я знаю, что в качестве функций порядковым данным можно назначить произвольные числа, а OneHotEncoding можно сделать для категориальных данных. Но я немного сбит с толку, как следует обрабатывать эти два типа данных, когда их следует прогнозировать. …
29 янв '20 в 22:40
3
ответа
Имеет ли смысл использовать Standard Scaler после применения Label Encoder?
Я начинаю проект с набором данных, который содержит более 5 тысяч уникальных значений для категории. Мой вопрос: после использования кодировщика меток для "перечисления" категорий имеет ли смысл использовать Standard Scaler, чтобы сделать данные бол…
19 мар '20 в 06:07
2
ответа
Кодирование категориальных переменных, таких как "Имена состояний"
У меня есть категориальный столбец с именами состояний. Я не уверен, какой тип категориального кодирования мне нужно будет выполнить, чтобы преобразовать их в числовой тип. Имеется 83 уникальных названия штатов. Label Encoder используется для порядк…
13 янв '20 в 15:08
1
ответ
Может кодировать категориальные данные в наборе поездов, но не в наборе тестов
Мне нужно закодировать категориальные значения в моем тестовом наборе, каким-то образом он бросает TypeError: argument must be a string or number. Я не знаю, почему это происходит, потому что я могу сделать это со своим поездом. Я имею в виду, что э…
13 мар '20 в 14:07
3
ответа
откуда взялась эта скобка?
Я новичок из панд и нахожусь на стадии фундаментальной. Я попытался закодировать некоторые данные и поместить те же столбцы в data_enc. from sklearn.preprocessing import LabelEncoder labelencoder = LabelEncoder() new_data = data[['HeatingQC']][:35].…
17 апр '20 в 20:20
1
ответ
Как преобразовать выходные данные модели для одного входа в один из классов прогнозирования?
Я использовал LabelEncoder для категориального вывода from keras.utils import np_utils from sklearn.preprocessing import LabelEncoder label = LabelEncoder() y_train = np_utils.to_categorical(label.fit_transform(y_train)) y_test = np_utils.to_categor…
20 апр '20 в 05:09
1
ответ
Используйте одинаковые критерии маркировки категорий на двух разных фреймах данных
У меня есть dataFrame, содержащий категориальную функцию, которую я закодировал следующим образом: df['categorical_feature'] = df['categorical_feature'].astype('category') df['labels'] = df['categorical_feature'].cat.codes Если я применяю тот же код…
24 апр '20 в 15:13
2
ответа
Sklearn Random Forrest разные значения точности для разных кодировок этикеток
Я использую sklearn Random Forrest для обучения своей модели. С теми же функциями ввода для модели я попытался сначала передать целевые метки с помощью label_binarize, чтобы создать одну горячую кодировку моих целевых меток, а во-вторых, я попытался…
18 май '20 в 01:25
2
ответа
Есть ли метод кодирования категориальной переменной, которая имеет более 500 различных значений?
У меня есть категориальный столбец с именем "activityNum", который важен для прогнозирования "количества" в наборе данных. В наборе данных activityNum более 500 значений. Значения представлены в формате "AP.507". Я пробовал использовать однократное …
25 май '20 в 03:11
0
ответов
Кодирование двух категориальных переменных
Я работаю над титаническим набором данных и наткнулся на препятствие. пожалуйста, помогите мне Я пытаюсь закодировать две разные категориальные переменные. Я не могу кодировать только одну из переменных. Я хочу закодировать переменные "Пол" и "Прикр…
12 июл '20 в 22:33
0
ответов
Кодирование метки зависимой переменной
Я работаю над проблемой классификации Multiclass, которая содержит более 500 labels.Я использую OneVsRest Classifier.Мой labels находятся в тексте формы. Я хочу преобразовать этот текст labels в числа, поэтому я использую LabelEncoder(). Я преобразо…
27 июл '20 в 14:04
1
ответ
Итерация в столбцах Dataframe с использованием имен столбцов в виде списка, а затем цикл по списку в Python
Я пытаюсь LabelEncode определенные столбцы Dataframe. Я сохранил имена этих столбцов в списке (cat_features). Теперь я хочу использовать цикл For для перебора элементов этого списка (которые являются строками) и использовать эти элементы для доступа…
29 июл '20 в 16:19