Разве в CUDA нет API-вызова, похожего на calloc()?

Question

Разве в CUDA нет API-вызова, похожего на calloc()?

Из рассмотрения Справочника по API CUDA 5.5 и Руководства по программированию CUDA C видно, что cudaCalloc()эквивалентный для стандартной библиотеки C встроенный графический процессор calloc(),

Неужели нет никакой API-функциональности для выделения буфера, инициализированного для всех нулей?
Есть ли что-то лучшее, что я могу сделать, чем позвонить cudaMalloc() а потом cudaMemset()?

6

c++ c cuda calloc memset

Источник

user1593077 20 янв '14 в 12:10

4 ответа

Решение

Вот решение со встроенной функцией. devPtrдолжен быть указателем на указатель на что-либо. Используя void*в качестве аргумента функции освобождает вызывающую сторону от применения приведения .

      inline cudaError_t
_cuda_calloc( void *devPtr, size_t size )
{
  cudaError_t err = cudaMalloc( (void**)devPtr, size );
  if( err == cudaSuccess ) err = cudaMemset( *(void**)devPtr, 0, size );
  return err;
}

1

Источник

user3876684 01 мар '22 в 07:29

Если вам нужен простой способ обнуления новых выделений, вы можете использовать thrust::device_vector, который по умолчанию создает свои элементы. Для примитивных типов это такое же поведение, как calloc,

1

Источник

user722294 21 янв '14 в 23:10

В CUDA нет внутренней операции вызова. Вы можете использовать следующее:

cudaMalloc(...)
cudaMemcpyAsync(..)

Обратите внимание, что это не заставляет хост ждать операции установки памяти.

0

Источник

user907166 20 янв '14 в 13:40

Другие вопросы по тегам c++ c cuda calloc memset

user1695960 20 янв '14 в 14:31 2014-01-20 14:31 · Accepted Answer · 2014-01-20 14:31

Неужели нет никакой API-функциональности для выделения буфера, инициализированного для всех нулей?

Там действительно нет.

Есть ли что-то лучшее, что я могу сделать, что cudaMalloc(), а затем cudaMemset()?

Вы можете использовать макрос, если это для удобства (вы не сказали нам, что вы подразумеваете под лучше, если ответ на первый вопрос - нет):

#define cudaCalloc(A, B, C) \
    do { \
        cudaError_t __cudaCalloc_err = cudaMalloc(A, B*C); \
        if (__cudaCalloc_err == cudaSuccess) cudaMemset(*A, 0, B*C); \
    } while (0)

Вышеупомянутый макрос будет работать с проверкой ошибок, которую я обычно делаю (которая основана на использовании cudaGetLastError(); или вы можете встроить предпочитаемую проверку ошибок непосредственно в макрос, если хотите. Смотрите этот вопрос об обработке ошибок.