NSight Compute Grid Size Несовместимая единица измерения

Я запускаю векторное ядро ​​следующим образом:

      //cuda processing sequence step 1 is complete
int blocks = 1;  // modify this line for experimentation
int threads = 1024; // modify this line for experimentation
vadd<<<blocks, threads>>>(d_A, d_B, d_C, DSIZE);

Затем я компилирую его с помощью

nvcc -o vector_add_2b vector_add.cu

И профилируйте его с помощью

nv-nsight-cu-cli -fo vector_add_2b ./vector_add_2b

Мне показалось странным, что размер сетки в Nsight Compute определяется как 1024,1,1, специально учитывая, что за этим размером следует X (block dimension)

Когда я писал этот вопрос, я также заметил, что в разделе « Статистика запуска » у них есть число, которое я ожидал: 1

Это заставляет меня поверить, что в первом случае размер сетки указывается в потоках, тогда как во втором — в блоках.

Почему это?

0 ответов

Другие вопросы по тегам