Как правильно инициализировать 2D поверхность в PyCUDA? (Pycuda._driver.LogicError)

Я пытаюсь инициализировать 2D поверхность в PyCUDA и заполнить ее значениями из массива NumPy 2D. Идея, как я понял, заключается в

  1. открыть drv.ArrayDescriptor,
  2. Создайте drv.Array используя этот дескриптор,
  3. скопировать данные из массива NumPy с помощью drv.Memcpy2D,
  4. делать set_array за SurfaceReference,

Но все же у меня есть pycuda._driver.LogicError на последнем шаге. Минимальный пример того, что я делаю:

import numpy as np
import pycuda.driver as drv
import pycuda.autoinit
from pycuda.compiler import SourceModule

mod = SourceModule("surface<void, cudaSurfaceType2D> fld_srf;")

def numpy2d_to_array(np_array):
    h, w = np_array.shape
    descr = drv.ArrayDescriptor()
    descr.width = w
    descr.height = h
    descr.format = drv.dtype_to_array_format(np_array.dtype)
    descr.num_channels = 1
    descr.flags = 0
    device_array = drv.Array(descr)
    copy = drv.Memcpy2D()
    copy.set_src_host(np_array)
    copy.set_dst_array(device_array)
    copy.width_in_bytes = copy.src_pitch = np_array.strides[0]
    copy.src_height = copy.height = h
    copy(aligned=True)
    return device_array

fld = np.random.random_integers(-30, 30, (1920, 1080)).astype(np.int32)
srf = mod.get_surfref('fld_srf')
srf_arr = numpy2d_to_array(fld.copy())
srf.set_array(srf_arr)

Код выше выдает следующее исключение:

Traceback (most recent call last):
  File "./testsurface.py", line 30, in <module>
    srf.set_array(srf_arr)
pycuda._driver.LogicError: cuSurfRefSetArray failed: invalid value

Есть идеи, как это сделать правильно? Или хотя бы почему эта ошибка появляется?

1 ответ

Это может быть связано с флагами: в 3D-случае вы должны установить descr.flags = drv.array3d_flags.SURFACE_LDST чтобы позволить связывание с поверхностью в соответствии с этим.

Я не нахожу 2D-эквивалент для Pycuda, хотя.

Другие вопросы по тегам