Странная ошибка "слишком много индексов для массива" в python
Давайте создадим большой массив np "а" с 10 000 записей
import numpy as np
a = np.arange(0, 10000)
Давайте разделим массив с индексами 'n' 0->9, 1->10, 2->11 и т. Д.
n = 32
b = list(map(lambda x:np.arange(x, x+10), np.arange(0, n)))
c = a[b]
Странная вещь, которую я получаю, это то, что если n меньше 32, я получаю ошибку "IndexError: слишком много индексов для массива". Если n больше или равно 32, тогда код работает отлично. Ошибка возникает независимо от размера исходного массива или размера отдельных фрагментов, но всегда с номером 32. Обратите внимание, что если n == 1, код работает.
Любая идея о том, что вызывает это? Спасибо.
2 ответа
Ваш b
это список массивов:
In [84]: b = list(map(lambda x:np.arange(x, x+10), np.arange(0, 5)))
In [85]: b
Out[85]:
[array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),
array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]),
array([ 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]),
array([ 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]),
array([ 4, 5, 6, 7, 8, 9, 10, 11, 12, 13])]
При использовании в качестве индекса:
In [86]: np.arange(1000)[b]
/usr/local/bin/ipython3:1: FutureWarning: Using a non-tuple sequence for multidimensional
indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`.
In the future this will be interpreted as an array index, `arr[np.array(seq)]`,
which will result either in an error or a different result.
#!/usr/bin/python3
---------------------------------------------------------------
IndexError: too many indices for array
A[1,2,3]
такой же как A[(1,2,3)]
то есть индексы, разделенные запятыми, являются кортежем, который затем передается в функцию индексации. Или, другими словами, многомерный индекс должен быть кортежем (который включает в себя индексы с ломтиками).
До сих пор numpy
был немного небрежным, и позволил нам использовать список индексов таким же образом. Предупреждение говорит нам, что разработчики ужесточают эти ограничения.
Ошибка означает, что она пытается интерпретировать каждый массив в вашем списке как индекс для отдельного измерения. Массив может иметь максимум 32 измерения. Очевидно, что для более длинного списка он не пытается рассматривать его как кортеж, а вместо этого создает двумерный массив для индексации.
Существуют различные способы использования вашего b
индексировать массив 1d:
In [87]: np.arange(1000)[np.hstack(b)]
Out[87]:
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3, 4, 5, 6, 7,
8, 9, 10, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 3, 4, 5, 6,
7, 8, 9, 10, 11, 12, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13])
In [89]: np.arange(1000)[np.array(b)] # or np.vstack(b)
Out[89]:
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
[ 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
[ 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
[ 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]])
In [90]: np.arange(1000)[b,] # 1d tuple containing b
Out[90]:
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
[ 2, 3, 4, 5, 6, 7, 8, 9, 10, 11],
[ 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
[ 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]])
Обратите внимание, что если b
рваный список - один или несколько массивов короче, только hstack
версия работает.
Прежде всего, вы не нарезаете 0->9, 10->19, 20->29; ваши кусочки продвигаются только на 1: 0->9, 1->10, 11->20. Вместо этого попробуйте это:
n = 32
size = 10
b = list(map(lambda x:np.arange(x, x+size), np.arange(0, n*size, size)))
Далее вы неправильно использовали индексную нотацию. b
список массивов, и вы использовали весь этот список для индексации a
, Когда вы проиндексировали больше элементов, чем существует в a
, numpy
предполагает, что вы хотите, чтобы сложный список был взят как последовательность ссылок, и использует их как отдельные индексные массивы, один a
элемент на лист элемент в b
,
Однако, как только вы опуститесь ниже предела len(a)
, затем numpy
Предположим, что вы пытаетесь дать многомерный срез в a
: каждый элемент b
берется как срез в соответствующее измерение a
, поскольку a
только 1-мерный, вы получаете сообщение об ошибке. Ваш код будет работать в этом режиме с n=1
, но терпит неудачу с n=2
и выше.
Хотя ваш вопрос не является дубликатом, пожалуйста, посмотрите этот.