Как правильно инициализировать 2D поверхность в PyCUDA? (Pycuda._driver.LogicError)
Я пытаюсь инициализировать 2D поверхность в PyCUDA и заполнить ее значениями из массива NumPy 2D. Идея, как я понял, заключается в
- открыть
drv.ArrayDescriptor
, - Создайте
drv.Array
используя этот дескриптор, - скопировать данные из массива NumPy с помощью
drv.Memcpy2D
, - делать
set_array
заSurfaceReference
,
Но все же у меня есть pycuda._driver.LogicError
на последнем шаге. Минимальный пример того, что я делаю:
import numpy as np
import pycuda.driver as drv
import pycuda.autoinit
from pycuda.compiler import SourceModule
mod = SourceModule("surface<void, cudaSurfaceType2D> fld_srf;")
def numpy2d_to_array(np_array):
h, w = np_array.shape
descr = drv.ArrayDescriptor()
descr.width = w
descr.height = h
descr.format = drv.dtype_to_array_format(np_array.dtype)
descr.num_channels = 1
descr.flags = 0
device_array = drv.Array(descr)
copy = drv.Memcpy2D()
copy.set_src_host(np_array)
copy.set_dst_array(device_array)
copy.width_in_bytes = copy.src_pitch = np_array.strides[0]
copy.src_height = copy.height = h
copy(aligned=True)
return device_array
fld = np.random.random_integers(-30, 30, (1920, 1080)).astype(np.int32)
srf = mod.get_surfref('fld_srf')
srf_arr = numpy2d_to_array(fld.copy())
srf.set_array(srf_arr)
Код выше выдает следующее исключение:
Traceback (most recent call last):
File "./testsurface.py", line 30, in <module>
srf.set_array(srf_arr)
pycuda._driver.LogicError: cuSurfRefSetArray failed: invalid value
Есть идеи, как это сделать правильно? Или хотя бы почему эта ошибка появляется?
1 ответ
Это может быть связано с флагами: в 3D-случае вы должны установить descr.flags = drv.array3d_flags.SURFACE_LDST
чтобы позволить связывание с поверхностью в соответствии с этим.
Я не нахожу 2D-эквивалент для Pycuda, хотя.