Структурированный двумерный массив Numpy: настройка имен столбцов и строк

Я пытаюсь найти хороший способ взять двумерный массив и прикрепить имена столбцов и строк в качестве структурированного массива. Например:

import numpy as np

column_names = ['a', 'b', 'c']
row_names    = ['1', '2', '3']

matrix = np.reshape((1, 2, 3, 4, 5, 6, 7, 8, 9), (3, 3))

# TODO: insert magic here

matrix['3']['a']  # 7

Я был в состоянии использовать установить столбцы, как это:

matrix.dtype = [(n, matrix.dtype) for n in column_names]

Это позволяет мне сделать matrix[2]['a'] но теперь я хочу переименовать строки, чтобы я мог сделать matrix['3']['a'],

1 ответ

Решение

Насколько я знаю, невозможно "назвать" строки с помощью чисто структурированных массивов NumPy.

Но если у вас есть панды, можно предоставить "индекс" (который по сути действует как "имя строки"):

>>> import pandas as pd
>>> import numpy as np
>>> column_names = ['a', 'b', 'c']
>>> row_names    = ['1', '2', '3']

>>> matrix = np.reshape((1, 2, 3, 4, 5, 6, 7, 8, 9), (3, 3))
>>> df = pd.DataFrame(matrix, columns=column_names, index=row_names)
>>> df
   a  b  c
1  1  2  3
2  4  5  6
3  7  8  9

>>> df['a']['3']      # first "column" then "row"
7

>>> df.loc['3', 'a']  # another way to index "row" and "column"
7
Другие вопросы по тегам