Ошибка в cudaMemcpyToSymbol при использовании CUDA 5
Эта проблема
Я подготовил один пример кода CUDA, используя постоянную память. Я могу успешно запустить это в cuda 4.2, но я получаю "недопустимый символ устройства" при компиляции с использованием CUDA 5. Я приложил пример кода здесь.
Код
#include <iostream>
#include <stdio.h>
#include <cuda_runtime.h>
#include <cuda.h>
struct CParameter
{
int A;
float B;
float C;
float D;
};
__constant__ CParameter * CONSTANT_PARAMETER;
#define PARAMETER "CONSTANT_PARAMETER"
bool ERROR_CHECK(cudaError_t Status)
{
if(Status != cudaSuccess)
{
printf(cudaGetErrorString(Status));
return false;
}
return true;
}
// Kernel that executes on the CUDA device
__global__ void square_array(float *a, int N)
{
int idx = blockIdx.x * blockDim.x + threadIdx.x;
if (idx<N)
{
a[idx] = CONSTANT_PARAMETER->A * a[idx];
}
}
////Main Function/////
int main(void)
{
/////Variable Definition
const int N = 10;
size_t size = N * sizeof(float);
cudaError_t Status = cudaSuccess;
CParameter * m_dParameter;
CParameter * m_hParameter;
float * m_D;
float * m_H;
//Memory Allocation Host
m_hParameter = new CParameter;
m_H = new float[N];
//Memory Allocation Device
cudaMalloc((void **) &m_D, size);
cudaMalloc((void**)&m_dParameter,sizeof(CParameter));
////Data Initialization
for (int i=0; i<N; i++)
m_H[i] = (float)i;
m_hParameter->A = 5;
m_hParameter->B = 3;
m_hParameter->C = 98;
m_hParameter->D = 100;
//Memory Copy from Host To Device
Status = cudaMemcpy(m_D, m_H, size, cudaMemcpyHostToDevice);
ERROR_CHECK(Status);
Status = cudaMemcpy(m_dParameter,m_hParameter,sizeof(CParameter),cudaMemcpyHostToDevice);
ERROR_CHECK(Status);
Status = cudaMemcpyToSymbol(PARAMETER, &m_dParameter, sizeof(m_dParameter));
ERROR_CHECK(Status);
// Do calculation on device:
int block_size = 4;
int n_blocks = N/block_size + (N%block_size == 0 ? 0:1);
square_array <<<n_blocks, block_size>>>(m_D,N);
// Retrieve result from device and store it in host array
cudaMemcpy(m_H, m_D, sizeof(float)*N, cudaMemcpyDeviceToHost);
// Print results
for (int i=0; i<N; i++)
printf("%d %f\n", i, m_H[i]);
// Cleanup
free(m_H);
free(m_hParameter);
cudaFree(m_dParameter);
cudaFree(m_D);
return 0;
}
Я пробовал WINDOWS: CUDA 5.0 Production Release, а видеокарта - GTX 590.
Любая помощь будет оценена.
2 ответа
Чтобы избежать "строкового типа", использование символьных строк для ссылки на символы устройства было объявлено устаревшим в функциях API времени выполнения CUDA в CUDA 4.1 и удалено в CUDA 5.0.
Примечания к выпуску CUDA 5 гласят:
** Использование символьной строки для обозначения символа устройства, что было возможно с некоторыми функциями API, больше не поддерживается. Вместо этого символ следует использовать напрямую.
Если вы измените свой код на следующий, он должен работать.
Status = cudaMemcpyToSymbol(CONSTANT_PARAMETER, &m_dParameter, sizeof(m_dParameter));
ERROR_CHECK(Status);
Из примечаний к выпуску CUDA 5.0:
** Использование символьной строки для обозначения символа устройства, что было возможно с некоторыми функциями API, больше не поддерживается. Вместо этого символ следует использовать напрямую. "
Эти функции API все еще существуют, но они принимают целевой символ-аргумент только как пустой идентификатор, а не как пустой идентификатор или строковый литерал, именующий идентификатор. Например
__ device__ __ constant__ type ident;
main() { cudaMemcpyToSymbol("ident", ...); } // no longer valid, returns cudaErrorInvalidSymbol
main() { cudaMemcpyToSymbol(ident, ...); } // valid
Так что избавьтесь от этого:
#define PARAMETER "CONSTANT_PARAMETER"
И измени это:
Status = cudaMemcpyToSymbol(PARAMETER, &m_dParameter, sizeof(m_dParameter));
К этому:
Status = cudaMemcpyToSymbol(CONSTANT_PARAMETER, &m_dParameter, sizeof(m_dParameter));
И я думаю, что это сработает.