NSight Compute Grid Size Несовместимая единица измерения
Я запускаю векторное ядро следующим образом:
//cuda processing sequence step 1 is complete
int blocks = 1; // modify this line for experimentation
int threads = 1024; // modify this line for experimentation
vadd<<<blocks, threads>>>(d_A, d_B, d_C, DSIZE);
Затем я компилирую его с помощью
nvcc -o vector_add_2b vector_add.cu
И профилируйте его с помощью
nv-nsight-cu-cli -fo vector_add_2b ./vector_add_2b
Мне показалось странным, что размер сетки в Nsight Compute определяется как
1024,1,1
, специально учитывая, что за этим размером следует
X (block dimension)
Когда я писал этот вопрос, я также заметил, что в разделе « Статистика запуска » у них есть число, которое я ожидал:
1
Это заставляет меня поверить, что в первом случае размер сетки указывается в потоках, тогда как во втором — в блоках.
Почему это?