Сортировка массива / повторного массива Python по столбцу
У меня довольно простой вопрос о том, как отсортировать весь массив / повторный массив по заданному столбцу. Например, учитывая массив:
import numpy as np
data = np.array([[5,2], [4,1], [3,6]])
Я хотел бы отсортировать данные по первому столбцу для возврата:
array([[3,6], [4,1], [5,2]])
4 ответа
Решение
Использование data[np.argsort(data[:, 0])]
где 0
индекс столбца для сортировки:
In [27]: import numpy as np
In [28]: data = np.array([[5,2], [4,1], [3,6]])
In [29]: col = 0
In [30]: data=data[np.argsort(data[:,col])]
Out[30]:
array([[3, 6],
[4, 1],
[5, 2]])
Ты ищешь operator.itemgetter
>>> from operator import itemgetter, attrgetter
>>> sorted(student_tuples, key=itemgetter(2))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
>>> sorted(student_objects, key=attrgetter('age'))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
т.е.
In [7]: a
Out[7]: [[5, 2], [4, 1], [3, 6]]
In [8]: sorted(a, key=operator.itemgetter(0))
Out[8]: [[3, 6], [4, 1], [5, 2]]
Это несколько сложно:
data[data[:,0].argsort()]
# data[:,n] -- get entire column of index n
# argsort() -- get the indices that would sort it
# data[data[:,n].argsort()] -- get data array sorted by n-th column
Я нашел этот рецепт здесь:
Для сортировки по второму столбцу используйте itemgetter
>>> from operator import itemgetter
>>> data = [[5,2], [4,1], [3,6]]
>>> sorted(data)
[[3, 6], [4, 1], [5, 2]]
>>> sorted(data,key=itemgetter(1))
[[4, 1], [5, 2], [3, 6]]
>>>
Вот расширение, которое работает со срезами:
import numpy as np
x = np.array([[9, 1, 2],
[5, 3, 4],
[0, 5, 6]])
Сортировка по строкам:
x[:, x[1,:].argsort()] # Sort by second row
array([[1, 2, 9]
[3, 4, 5]
[5, 6, 0]])
Сортировка по столбцам:
x[x[:,0].argsort(), :] # Sort by first column
array([[0, 5, 6],
[5, 3, 4],
[9, 1, 2]])