Ядро зависает при использовании каналов OpenCL

Я пытаюсь написать ядро ​​OpenCL, которое использует каналы OpenCL. Код ядра приведен ниже.

    uint tid = get_global_id(0);
    uint numWorkItems = get_global_size(0);
    int i;
    int rid;
    int temp = 0, temp1 = 0;
    int val;

    int    szgr = get_local_size(0);
    int    lid  = get_local_id(0);

    for(i = tid + start_index; i < rLen; i = i + numWorkItems){
            temp = 0;
            val = input[i];
            temp = hashTable[val - 1];
            if(temp){
                    temp1 = projection[val - 1];
            }

            reserve_id_t rid1 = work_group_reserve_write_pipe(c0, szgr);

            while(is_valid_reserve_id(rid1) == false){
            rid1 = work_group_reserve_write_pipe(c0, szgr);
            }

            if(is_valid_reserve_id(rid1))
            {

                    write_pipe(c0,rid1,lid, &temp);
                    work_group_commit_write_pipe(c0, rid1);
            }

            reserve_id_t rid2 = work_group_reserve_write_pipe(c1, szgr);

            while(is_valid_reserve_id(rid2) == false){
            rid2 = work_group_reserve_write_pipe(c1, szgr);
            }

            if(is_valid_reserve_id(rid2))
            {

                    write_pipe(c1,rid2,lid, &temp1);
                    work_group_commit_write_pipe(c1, rid2);
            }
    }

Но функция work_group_reserve_write_pipe всегда дает сбой, и из-за этого ядра зависают в цикле while. Если я удаляю этот цикл while, тогда код не зависает, но запись в канал не происходит. Может кто-нибудь сказать мне, почему это происходит?

Канал объявлен как канал _write_only.

1 ответ

Решение

О work_group_reserve_write_pipe:

Эта встроенная функция должна встречаться всеми рабочими элементами в рабочей группе, выполняющей ядро ​​с одинаковыми значениями аргументов; в противном случае поведение не определено.

цикл начинается с tid + start_index поэтому после некоторых итераций цикла некоторые рабочие элементы не попадают в эту инструкцию. Также цикл while выполняет то же неопределенное поведение.

Другие вопросы по тегам