Странная ошибка "слишком много индексов для массива" в python

Давайте создадим большой массив np "а" с 10 000 записей

import numpy as np
a = np.arange(0, 10000)

Давайте разделим массив с индексами 'n' 0->9, 1->10, 2->11 и т. Д.

n = 32
b = list(map(lambda x:np.arange(x, x+10), np.arange(0, n)))
c = a[b]

Странная вещь, которую я получаю, это то, что если n меньше 32, я получаю ошибку "IndexError: слишком много индексов для массива". Если n больше или равно 32, тогда код работает отлично. Ошибка возникает независимо от размера исходного массива или размера отдельных фрагментов, но всегда с номером 32. Обратите внимание, что если n == 1, код работает.

Любая идея о том, что вызывает это? Спасибо.

2 ответа

Решение

Ваш b это список массивов:

In [84]: b = list(map(lambda x:np.arange(x, x+10), np.arange(0, 5)))            
In [85]: b                                                                      
Out[85]: 
[array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]),
 array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10]),
 array([ 2,  3,  4,  5,  6,  7,  8,  9, 10, 11]),
 array([ 3,  4,  5,  6,  7,  8,  9, 10, 11, 12]),
 array([ 4,  5,  6,  7,  8,  9, 10, 11, 12, 13])]

При использовании в качестве индекса:

In [86]: np.arange(1000)[b]                                                     
/usr/local/bin/ipython3:1: FutureWarning: Using a non-tuple sequence for multidimensional 
indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`. 
In the future this will be interpreted as an array index, `arr[np.array(seq)]`, 
which will result either in an error or a different result.
  #!/usr/bin/python3
---------------------------------------------------------------
IndexError: too many indices for array

A[1,2,3] такой же как A[(1,2,3)] то есть индексы, разделенные запятыми, являются кортежем, который затем передается в функцию индексации. Или, другими словами, многомерный индекс должен быть кортежем (который включает в себя индексы с ломтиками).

До сих пор numpy был немного небрежным, и позволил нам использовать список индексов таким же образом. Предупреждение говорит нам, что разработчики ужесточают эти ограничения.

Ошибка означает, что она пытается интерпретировать каждый массив в вашем списке как индекс для отдельного измерения. Массив может иметь максимум 32 измерения. Очевидно, что для более длинного списка он не пытается рассматривать его как кортеж, а вместо этого создает двумерный массив для индексации.

Существуют различные способы использования вашего b индексировать массив 1d:

In [87]: np.arange(1000)[np.hstack(b)]                                          
Out[87]: 
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9,  1,  2,  3,  4,  5,  6,  7,
        8,  9, 10,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11,  3,  4,  5,  6,
        7,  8,  9, 10, 11, 12,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13])

In [89]: np.arange(1000)[np.array(b)]    # or np.vstack(b)                                       
Out[89]: 
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [ 2,  3,  4,  5,  6,  7,  8,  9, 10, 11],
       [ 3,  4,  5,  6,  7,  8,  9, 10, 11, 12],
       [ 4,  5,  6,  7,  8,  9, 10, 11, 12, 13]])

In [90]: np.arange(1000)[b,]             # 1d tuple containing b                                       
Out[90]: 
array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [ 2,  3,  4,  5,  6,  7,  8,  9, 10, 11],
       [ 3,  4,  5,  6,  7,  8,  9, 10, 11, 12],
       [ 4,  5,  6,  7,  8,  9, 10, 11, 12, 13]])

Обратите внимание, что если b рваный список - один или несколько массивов короче, только hstack версия работает.

Прежде всего, вы не нарезаете 0->9, 10->19, 20->29; ваши кусочки продвигаются только на 1: 0->9, 1->10, 11->20. Вместо этого попробуйте это:

n = 32
size = 10
b = list(map(lambda x:np.arange(x, x+size), np.arange(0, n*size, size)))

Далее вы неправильно использовали индексную нотацию. b список массивов, и вы использовали весь этот список для индексации a, Когда вы проиндексировали больше элементов, чем существует в a, numpy предполагает, что вы хотите, чтобы сложный список был взят как последовательность ссылок, и использует их как отдельные индексные массивы, один a элемент на лист элемент в b,

Однако, как только вы опуститесь ниже предела len(a), затем numpy Предположим, что вы пытаетесь дать многомерный срез в a: каждый элемент b берется как срез в соответствующее измерение a, поскольку a только 1-мерный, вы получаете сообщение об ошибке. Ваш код будет работать в этом режиме с n=1, но терпит неудачу с n=2 и выше.

Хотя ваш вопрос не является дубликатом, пожалуйста, посмотрите этот.

Другие вопросы по тегам