Структурированный двумерный массив Numpy: настройка имен столбцов и строк
Я пытаюсь найти хороший способ взять двумерный массив и прикрепить имена столбцов и строк в качестве структурированного массива. Например:
import numpy as np
column_names = ['a', 'b', 'c']
row_names = ['1', '2', '3']
matrix = np.reshape((1, 2, 3, 4, 5, 6, 7, 8, 9), (3, 3))
# TODO: insert magic here
matrix['3']['a'] # 7
Я был в состоянии использовать установить столбцы, как это:
matrix.dtype = [(n, matrix.dtype) for n in column_names]
Это позволяет мне сделать matrix[2]['a']
но теперь я хочу переименовать строки, чтобы я мог сделать matrix['3']['a']
,
1 ответ
Решение
Насколько я знаю, невозможно "назвать" строки с помощью чисто структурированных массивов NumPy.
Но если у вас есть панды, можно предоставить "индекс" (который по сути действует как "имя строки"):
>>> import pandas as pd
>>> import numpy as np
>>> column_names = ['a', 'b', 'c']
>>> row_names = ['1', '2', '3']
>>> matrix = np.reshape((1, 2, 3, 4, 5, 6, 7, 8, 9), (3, 3))
>>> df = pd.DataFrame(matrix, columns=column_names, index=row_names)
>>> df
a b c
1 1 2 3
2 4 5 6
3 7 8 9
>>> df['a']['3'] # first "column" then "row"
7
>>> df.loc['3', 'a'] # another way to index "row" and "column"
7