Ускорьте программу, которая вычисляет среднее число соседей в огромном массиве

У меня проблема со скоростью моей программы. Я хочу рассчитать среднее значение по четырем соседям в огромном массиве. Вот часть моего кода. У вас есть идеи, как изменить последнюю строку? Или я должен использовать другой массив?

for a in np.arange(100000):
    for x in np.arange(size):
        for y in np.arange(size):
            if unchangeableflag[x*size+y] == 0:
                vnew[x*size+y] = (v[(x+1)*size+y] + v[(x-1)*size+y] + v[x*size+y+1] + v[x*size+y-1]) / 4.0

3 ответа

Решение

Вам не понадобится петля вообще. Если предположить, v, vnew а также unchangeableflag 1-й массивы с size*size записи, вы можете сделать

v = v.reshape(size, size)
vnew = vnew.reshape(size, size)
unchangeableflag = unchangeableflag.reshape(size, size)
average = v[1:-1, 2:]
average += v[1:-1, :-2] 
average += v[2:, 1:-1]
average += v[-2:, 1:-1]
average /= 4.0
vnew[1:-1, 1:-1][unchangeableflag[1:-1, 1:-1] == 0] = average

Но чего вы на самом деле пытаетесь достичь? Это выглядит подозрительно, как будто вы можете сойтись с некоторым применением дискретного лапласиана.

(Обратите внимание, что это предполагает, что v содержит числа с плавающей запятой Если dtype `v´ - это целочисленный тип sime, вам нужна небольшая модификация.)

Вы должны рассмотреть возможность использования сверточного фильтра SciPy или generic_filter. Это все еще требует больших вычислительных ресурсов, но намного быстрее, чем циклы. Обычно, когда выполняется усреднение этого типа, также включается центральный элемент. Обратите внимание, что эти решения также применимы к многомерным массивам.

from scipy import ndimage
footprint = scipy.array([[0,0.25,0],[0.25,0,0.25],[0,0.25,0]])
filtered_array = scipy.convolve(array, footprint)

ИЛИ ЖЕ

from scipy import ndimage
def myfunction(window):
    return (window[0,1] + window[1,0] + window[1,2] + window[2,1]) / 4
filtered_array = scipy.generic_filter(array, myfunction, size=3)

Я не уверен, но вы можете удалить некоторые инварианты.

for a in np.arange(100000):
    for x in np.arange(size):
        for y in np.arange(size):
            t = x*size+y
            if unchangeableflag[t] == 0:
                vnew[t] = (v[t+size] + v[t-size] + v[t+1] + v[t-1]) / 4.0
Другие вопросы по тегам