Pandas Multiindex выбирает список столбцов с заданного уровня
Если я сделаю мультииндексированный столбец данных, например, так:
iterables = [['bar', 'baz', 'foo', 'qux'], ['one', 'two']]
index = pd.MultiIndex.from_product(iterables, names=['first', 'second'])
df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index)
first bar baz foo qux \
second one two one two one two one
A -0.119687 -0.518318 0.113920 -1.028505 1.106375 -1.020139 -0.039300
B 0.123480 -2.091120 0.464597 -0.147211 -0.489895 -1.090659 -0.592679
C -1.174376 0.282011 -0.197658 -0.030751 0.117374 1.591109 0.796908
first
second two
A -0.938209
B -0.851483
C 0.442621
и я хочу выбрать столбцы только из первого набора столбцов, используя список,
select_cols=['bar', 'qux']
такой, что результат будет:
first bar qux
second one two one two
A -0.119687 -0.518318 -0.039300 -0.938209
B 0.123480 -2.091120 -0.592679 -0.851483
C -1.174376 0.282011 0.796908 0.442621
Как бы я поступил так? (Заранее спасибо)
2 ответа
Решение
Простой выбор столбцов работает также:
df[['bar', 'qux']]
# first bar qux
# second one two one two
# A 0.651522 0.480115 -2.924574 0.616674
# B -0.395988 0.001643 0.358048 0.022727
# C -0.317829 1.400970 -0.773148 1.549135
Ты можешь использовать loc
выбрать столбцы:
df.loc[:, ["bar", "qux"]]
# first bar qux
# second one two one two
# A 1.245525 -1.469999 -0.399174 0.017094
# B -0.242284 0.835131 -0.400847 -0.344612
# C -1.067006 -1.880113 -0.516234 -0.410847
Когда я нашел этот вопрос /A I, подумал, что могу увидеть решение, которое печатает имена столбцов. Разобравшись с этим, я подумал, что могу добавить к ответу. Ниже приведены значения имени столбца для данного уровня.
df.columns.get_level_values(0)
=> ['bar', 'qux']
- E