OpenCL: несоответствие пространства состояний между инструкцией и адресом

Я пишу программу OpenCL и при сборке я получаю эту ошибку:

Build Log:
ptxas application ptx input, line 268; error   : State space mismatch between instruction and address in instruction 'ld'
ptxas application ptx input, line 269; error   : State space mismatch between instruction and address in instruction 'ld'
ptxas application ptx input, line 270; error   : State space mismatch between instruction and address in instruction 'ld'
ptxas application ptx input, line 271; error   : State space mismatch between instruction and address in instruction 'ld'
....(same error on several more lines)

Соответствующие строки ptx (автоматически сгенерированные):

ld.local.u32    %r1913, [demands$inst_to_cust+16];
ld.local.u32    %rl10, [demands$inst_to_cust+12];
ld.local.u32    %rl12, [demands$inst_to_cust+8];
ld.local.u32    %rl14, [demands$inst_to_cust+4];
ld.local.u32    %rl16, [demands$inst_to_cust];

Вот функция, которую я написал:

int
demands(cl_ushort ball, cl_ushort bin,
    __global const struct problem *problem,
    __constant const struct demand *demand,
    const cl_ushort soln[BALL_MAXNUM],
    struct demand_op ops[DEMAND_MAXOPS],
    __global cl_ushort debug_data[DEBUG_LEN])
{
int i, k = demand->data[0]; 
int serv_to_rack[] = {0, 1, 1}; 
int inst_to_cust[] = {0, 0, 0, 1, 1}; 
int maxinst_per_rack[] = {2, 1}; 

int cust_num = inst_to_cust[ball];
int max = ball, min = ball, count = 1;
int max_in_rack = maxinst_per_rack[cust_num];
for (i = ball; i < NUM_BALLS; i++) {
    if (inst_to_cust[i] == ball) max = i;
    else break;
}

.....
}

В чем причина ошибки? Как это можно решить?

1 ответ

Решение

Компилятор не понимает, где находится demand структура. "пространство состояний" - это ptx-talk для типа памяти. ld.local ожидает, что источник находится в локальной памяти, но в вашем случае, похоже, что он на самом деле находится в постоянной памяти.

Я не знаком с OpenCL, но в CUDA __constant__ Спецификатор помещает переменные в постоянную память, которая имеет особую семантику кэширования. Это не связано с const в C++. Может случиться так, что компилятор запутался, потому что вы используете их вместе.

Попробуйте удалить один или оба __constant а также const от __constant const struct demand *demand линия.

Другие вопросы по тегам