Соответствующие индексы в python для категоризации столбца

Question

Соответствующие индексы в python для категоризации столбца

У меня есть столбец в кадре данных длиной 1083 с 143 уникальными значениями. Чтобы проиллюстрировать мой вопрос, 6 из них:

пекарня
больница
Гостиница
зубной врач
Университет
ресторан

Я создал еще один фрейм данных, 2x1. Первый столбец содержит 143 уникальных значения, а второй содержит то, что я хочу, чтобы каждое из них было классифицировано как. например:

 1. bakery       commercial
 2. hospital     commerical
 3. hotel        hospitality
 4. dentist      commercial
 5. university   education
 6. restaurant   hospitality

Мне было интересно, как бы я создал новый столбец в моем исходном df, сопоставляя индексы так, чтобы для любой записи в столбце, которая = "хлебобулочные изделия", была бы "коммерческая" в новом столбце.

0

python dataframe match

Источник

user5564959 21 ноя '15 в 16:57

2 ответа

Решение

Вы можете использовать словари, определенные где-то в вашей программе... обращайтесь к нему всякий раз, когда вы пытаетесь создать новый столбец...

categories = {"bakery" : "commercial", ... }

затем вы вызываете словарь всякий раз, когда вам нужно извлечь соответствующее значение:

categories["bakery"] # will return "commercial"

0

Источник

user5500791 21 ноя '15 в 17:42

Другие вопросы по тегам python dataframe match

user4790497 21 ноя '15 в 17:42 2015-11-21 17:42 · Accepted Answer · 2015-11-21 17:42

Вы могли бы использовать merge и сделать что-то вроде этого:

import pandas as pd
df = pd.merge(  left=firstDataFrame, right=secondDataFrame, on='NameOfColumnContainingBakery...')

Имя столбца в on='' должен быть одинаковым в обоих таймфреймах.

Это объединяет два фрейма данных в один, который содержит дополнительный столбец, как вы его описали.

Надеюсь, это поможет.