В Python, как передать скалярный аргумент в ядро ​​OpenCL?

Я использую привязки Python для OpenCL, и я написал ядро, которое ожидает скалярный (float) аргумент, но я не могу найти правильный способ передать его.

Если я просто призываю

prg.bloop(queue, [width,height], None, centers_g, 16/9, result_g)

Я получаю эту ошибку:

pyopencl.cffi_cl.LogicError: when processing argument #2 (1-based): 'float' does not support the buffer interface

Если я заверну это numpy.float32(16/9) тогда ядро ​​ведет себя так, как будто ему было передано 0 вместо 1.7777777 .

Вот больше исходного кода на тот случай, если это поможет вам понять, что я делаю.

def mission2(cells, width, height):
    ctx = cl.create_some_context()
    queue = cl.CommandQueue(ctx)

    centers = numpy.array(list(cells), dtype=numpy.float32)

    centers_g = cl.Buffer(ctx, cl.mem_flags.READ_ONLY|cl.mem_flags.COPY_HOST_PTR, hostbuf = centers)

    prg = cl.Program(ctx, """
__kernel void test1(__global char *out) {
    out[0] = 77;
}

float sphere(float r, float x, float y)
{
    float q = r*r-(x*x+y*y);
    if (q<0)
        return 0;
    return sqrt(q);
}

__kernel void bloop(__global const float centers[][6], float aspect, __global char * out)
{
    int u = get_global_id(0);
    int v = get_global_id(1);
    int width = get_global_size(0);
    int height = get_global_size(1);

    float x = u/(float)width * aspect;
    float y = v/(float)height;

    float max = sphere(0.3, x-centers[0][0], y-centers[0][1]);

    int idx = u+v*width;
    out[idx] = 255*max;

}

    """).build()

    result_g = cl.Buffer(ctx, cl.mem_flags.WRITE_ONLY, width*height)


    if False:
        prg.test1(queue, [width,height], None, result_g)
    else:
        prg.bloop(queue, [width,height], None, centers_g, numpy.float32(16/9), result_g)


    result = numpy.zeros([height,width], dtype=numpy.uint8)
    future = cl.enqueue_copy(queue, result, result_g)
    future.wait()

    print(result)

    imsave("/tmp/bloop.png", result, cmap = matplotlib.pyplot.get_cmap('gray'))

1 ответ

Решение

Чтобы передать скаляры ядру OpenCL, вы можете использовать функцию set_scalar_arg_dtypes следующим образом:

kernel = prg.bloop
kernel.set_scalar_arg_dtypes( [None, numpy.float32, None] )
kernel(queue, [width, height], None, centers_g, aspect, result_g)

На странице руководства четко указано, что она не будет работать, если вы напишите ее так:

prg.bloop.set_scalar_arg_dtypes( [None, numpy.float32, None] )
# this will fail:
prg.bloop(queue, [width, height], None, centers_g, 16/9, result_g)

потому что "Информация, установленная этой процедурой, прикреплена к одному экземпляру ядра. Новый экземпляр ядра создается каждый раз, когда вы используете доступ к атрибуту program.kernel".

Другие вопросы по тегам