Почему возврат cudaLaunchCooperativeKernel() не разрешен?

Question

Почему возврат cudaLaunchCooperativeKernel() не разрешен?

Поэтому я использую GTX 1050 с вычислительной мощностью 6.1 с CUDA 11.0. Мне нужно использовать синхронизацию сетки в моей программе, поэтому cudaLaunchCooperativeKernel()нужно. Я проверил свой запрос устройства, поэтому GPU поддерживает совместные группы. Я не могу выполнить следующую функцию

       extern "C" __global__ void test(int x) {
    if (x) {
       printf("%d", x);
       if (threadIdx.x == 0)
          test<<<1, 1>>>(--x);
    }
}

После звонка,

      cudaLaunchCooperativeKernel((void *)test, 1, 1, (void **) (&x));

получение ошибки «операция не разрешена» (код 800). Теперь это возвращается, когда устройство не поддерживает кооперативные группы (не в этом случае). Итак, что может вызвать эту проблему?

0

cuda dynamic-parallelism gpu-cooperative-groups

Источник

user7529045 22 дек '20 в 09:23

1 ответ

Другие вопросы по тегам cuda dynamic-parallelism gpu-cooperative-groups

user5206464 22 дек '20 в 11:22 2020-12-22 11:22 · Answer 1 · 2020-12-22 11:22

Ваше ядро использует динамический параллелизм. Однако динамический параллелизм не допускается в ядрах, запускаемых через cudaLaunchCooperativeKernel

Это упоминается в документации по API среды выполнения. https://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__EXECUTION.html