Ошибка в cudaMemcpyToSymbol при использовании CUDA 5

Question

Ошибка в cudaMemcpyToSymbol при использовании CUDA 5

Эта проблема

Я подготовил один пример кода CUDA, используя постоянную память. Я могу успешно запустить это в cuda 4.2, но я получаю "недопустимый символ устройства" при компиляции с использованием CUDA 5. Я приложил пример кода здесь.

Код

#include <iostream>
#include <stdio.h>
#include <cuda_runtime.h>
#include <cuda.h>

struct CParameter
{
    int A;  
    float B;
    float C;
    float D;
};

__constant__ CParameter * CONSTANT_PARAMETER;   
#define PARAMETER "CONSTANT_PARAMETER"

bool ERROR_CHECK(cudaError_t Status)
{
    if(Status != cudaSuccess)
    {
        printf(cudaGetErrorString(Status));
        return false;
    }   
    return true;
}

// Kernel that executes on the CUDA device
__global__ void square_array(float *a, int N)
{
  int idx = blockIdx.x * blockDim.x + threadIdx.x;
  if (idx<N)
  {
      a[idx] = CONSTANT_PARAMETER->A * a[idx];
  }
}
////Main Function/////
int main(void)
{
    /////Variable Definition
    const int N = 10;
    size_t size = N * sizeof(float);
    cudaError_t Status = cudaSuccess;

    CParameter * m_dParameter;
    CParameter * m_hParameter;
    float * m_D;
    float * m_H;

    //Memory Allocation Host
    m_hParameter = new CParameter;
    m_H = new float[N];

    //Memory Allocation Device
    cudaMalloc((void **) &m_D, size);
    cudaMalloc((void**)&m_dParameter,sizeof(CParameter));

    ////Data Initialization
    for (int i=0; i<N; i++) 
        m_H[i] = (float)i;

    m_hParameter->A = 5;
    m_hParameter->B = 3;
    m_hParameter->C = 98;
    m_hParameter->D = 100;

    //Memory Copy from Host To Device
    Status = cudaMemcpy(m_D, m_H, size, cudaMemcpyHostToDevice);
    ERROR_CHECK(Status);

    Status = cudaMemcpy(m_dParameter,m_hParameter,sizeof(CParameter),cudaMemcpyHostToDevice);
    ERROR_CHECK(Status);        

    Status = cudaMemcpyToSymbol(PARAMETER, &m_dParameter, sizeof(m_dParameter));
    ERROR_CHECK(Status);

    // Do calculation on device:
    int block_size = 4;

    int n_blocks = N/block_size + (N%block_size == 0 ? 0:1);

    square_array <<<n_blocks, block_size>>>(m_D,N);

    // Retrieve result from device and store it in host array
    cudaMemcpy(m_H, m_D, sizeof(float)*N, cudaMemcpyDeviceToHost);

    // Print results
    for (int i=0; i<N; i++)
        printf("%d %f\n", i, m_H[i]);

    // Cleanup
    free(m_H);
    free(m_hParameter);
    cudaFree(m_dParameter);
    cudaFree(m_D);
    return 0;   
}

Я пробовал WINDOWS: CUDA 5.0 Production Release, а видеокарта - GTX 590.
Любая помощь будет оценена.

14

c cuda gpu-constant-memory

Источник

user1755010 18 окт '12 в 05:48

2 ответа

Решение

Из примечаний к выпуску CUDA 5.0:

** Использование символьной строки для обозначения символа устройства, что было возможно с некоторыми функциями API, больше не поддерживается. Вместо этого символ следует использовать напрямую. "

Эти функции API все еще существуют, но они принимают целевой символ-аргумент только как пустой идентификатор, а не как пустой идентификатор или строковый литерал, именующий идентификатор. Например

__ device__ __ constant__ type ident;

main() { cudaMemcpyToSymbol("ident", ...); } // no longer valid, returns cudaErrorInvalidSymbol

main() { cudaMemcpyToSymbol(ident, ...); }   // valid

Так что избавьтесь от этого:

#define PARAMETER "CONSTANT_PARAMETER"

И измени это:

Status = cudaMemcpyToSymbol(PARAMETER, &m_dParameter, sizeof(m_dParameter));

К этому:

Status = cudaMemcpyToSymbol(CONSTANT_PARAMETER, &m_dParameter, sizeof(m_dParameter));

И я думаю, что это сработает.

10

Источник

user1695960 18 окт '12 в 06:16

Другие вопросы по тегам c cuda gpu-constant-memory

user749748 18 окт '12 в 06:14 2012-10-18 06:14 · Accepted Answer · 2012-10-18 06:14

Чтобы избежать "строкового типа", использование символьных строк для ссылки на символы устройства было объявлено устаревшим в функциях API времени выполнения CUDA в CUDA 4.1 и удалено в CUDA 5.0.

Примечания к выпуску CUDA 5 гласят:

** Использование символьной строки для обозначения символа устройства, что было возможно с некоторыми функциями API, больше не поддерживается. Вместо этого символ следует использовать напрямую.

Если вы измените свой код на следующий, он должен работать.

Status = cudaMemcpyToSymbol(CONSTANT_PARAMETER, &m_dParameter, sizeof(m_dParameter));
ERROR_CHECK(Status);