"nvcc" - это компилятор C / C++ на основе LLVM от NVIDIA для работы с графическими процессорами с помощью CUDA.
1 ответ

Многочисленные ошибки определения функций cuSparse при связывании файлов CUDA в исполняемом файле

Мой проект состоит из пяти файлов CUDA: main.cu jacobian_kernel.cu hermite_kernel.cu cuSolver_LU.cpp Utilities.cu, последний из которых адаптирован из этого репозитория GitHub, вместе с его Utilities.h заголовочный файл; три заголовка args.h linear_…
28 ноя '16 в 23:15
1 ответ

Как скомпилировать / связать код с различными вычислительными возможностями против cublas_device?

Я работаю с динамическим параллелизмом (и cublas) в одном из моих ядер и хочу предоставить резервное ядро ​​для sm_20. В maxentropy_cuda.cu я написал оба ядра и использовал CUDA_ARCH для компиляции ядра динамического параллелизма только для архитект…
25 июн '13 в 14:03
1 ответ

CMake + CUDA + отделимая компиляция -> "nvcc не знает, что делать с ' ' "

Я использую CMake для моего проекта с участием CUDA. Недавно мне пришлось включить "раздельную компиляцию" некоторых из моих кодов CUDA: set(CUDA_SEPARABLE_COMPILATION ON) но потом строительство начало рушиться. В качестве примера может произойти сл…
15 фев '18 в 11:56
2 ответа

CUDA статически распределяет данные на устройстве

Я пытался выделить переменную, к которой может обращаться каждая функция ядра. Моя попытка - это код, прикрепленный ниже, но он не скомпилируется, потому что ядро ​​не может просмотреть dArray. В C++ вы должны поместить переменную вверху или объявит…
11 май '11 в 11:14
1 ответ

Ошибка при компиляции библиотеки Eigen v3.3.4 с VS2017 + nvcc (CUDA 9.0)

Я попытался скомпилировать следующий код, где я использую Eigen и CUDA одновременно, и я получаю ошибку. #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include <iostream> #include <Eigen/Dense> …
19 янв '18 в 12:41
1 ответ

Базовые блоки в CUDA

Есть ли способ просмотреть информацию о базовых блоках для исходного кода CUDA? Я пытаюсь скомпилировать код CUDA так, чтобы вывод, который он мне дал, был файлом со всеми перечисленными базовыми блоками. Но до сих пор я не смог найти ни одной опции…
11 сен '15 в 01:17
0 ответов

Скомпилированная nvcc программа, похоже, сбивает с толку пространства имен math.h и cmath.h

Я собираю программу CUDA, которая, кажется, запуталась (или, возможно, я запуталась) по поводу пространств имен, используемых cmath и math. Когда я бегу makeЯ получаю следующий вывод: innovationcommons@IC-VR1:~/PackageDownloads/warp-ctc/build$ make …
15 дек '17 в 15:47
1 ответ

Почему cuda-memcheck racecheck сообщает об ошибках с помощью cufft?

Инструмент racecheck сообщил о скачках памяти с моим приложением. Я выделил его для exec-функций CUFFT. Я делаю что-то неправильно? Если нет, то как я могу заставить гонку игнорировать это? Вот минимальный пример того, что при запуске в cuda-memchec…
05 окт '16 в 11:46
1 ответ

Компилятор nvcc не оптимизируется

Почему компилятор не выполняет тривиальные оптимизации, которые можно выполнить в ядре? У меня есть следующий код для умножения матриц: __global__ void matrixMultiply(float * A, float * B, float * C, int numARows, int numAColumns, int numBRows, int …
27 июн '14 в 17:45
1 ответ

Установка nvcc

Есть ли способ установить только компилятор nvcc без установки инструментария cuda? Я хочу это, потому что я хочу скомпилировать программу CUDA только для проверки синтаксиса. Пожалуйста, предложите, если есть какие-либо другие способы проверки синт…
26 окт '15 в 13:45
1 ответ

Ошибка связи динамического параллелизма cuda c

Я пытаюсь связать свою программу динамического параллелизма в CUDA Kepler следующим образом: nvcc -m32 -arch=sm_35 -dc -Xcompiler '-fPIC' DFS_Solving.cu nvcc -m32 -arch=sm_35 -Xcompiler '-fPIC' -dlink DFS_Solving.o -o link.o gcc -shared -Wl,-soname,…
11 мар '15 в 15:31
2 ответа

Ошибка связи с CUDA 7.5 в Windows 10 (из проекта Theano): ошибка MSVCRT.lib LNK2019: неразрешенный внешний символ

Я пытаюсь правильно настроить CUDA, чтобы использовать преимущества графического процессора в Theano. После исправления многих проблем компиляции путем настройки моего .theanorc а также nvcc.profile файлы, я изо всех сил пытаюсь исправить эту ошибку…
08 авг '15 в 11:16
1 ответ

Почему мы не можем разделить реализации __host__ и __device__?

Если у нас есть __host__ __device__ Функция в CUDA, мы можем использовать макросы для выбора различных путей кода для кода на стороне хоста и на стороне устройства в его реализациях, например, так: __host__ __device__ int foo(int x) { #ifdef CUDA_AR…
14 окт '18 в 08:53
1 ответ

Разница в создании контекста CUDA

У меня есть программа, которая использует три ядра. Чтобы получить ускорения, я делал фиктивную копию памяти, чтобы создать контекст следующим образом: __global__ void warmStart(int* f) { *f = 0; } который запускается до ядра я хочу, чтобы время сле…
09 ноя '12 в 18:34
1 ответ

Недопустимая ошибка символа устройства в зависимости от флагов nvcc

Игрушечная программа: #include <iostream> #include <vector> // Matrix side size (they are square). const int N = 3; const int num_mats = 14; // Rotation matrices. __constant__ float rot_mats_device[num_mats*N*N]; int main() { std::vector…
15 мар '17 в 15:23
2 ответа

Использование GHC с NVCC

В качестве альтернативы ускорению я пытаюсь вызвать код CUDA вместо FFI на Haskell. Вот простая программа, которая не компилируется: cuda_code.cu: void cuda_init() { cudaFree (0); cudaThreadSynchronize (); } Test.hs: foreign import ccall unsafe "cud…
13 ноя '13 в 15:02
3 ответа

Как найти библиотечную зависимость?

Я на машине с Linux, на которой у меня нет прав root. На этой машине установлен Boost 1.36, но мне нужна более новая версия boost, поэтому я установил локальную версию Boost 1.62. Я связываю некоторые объектные файлы с помощью nvcc. Ссылка также вкл…
04 май '17 в 14:01
2 ответа

Pycuda - Как добавить -ccbin clang-3.8

В настоящее время я пытаюсь использовать PyCUDA на Debian 9. Мне уже удается заставить cuda работать, и если я запускаю: nvcc -ccbin clang-3.8 file.cu Я правильно компилирую файл и могу его запустить. Тем не менее, после того, как я установил Pycuda…
23 мар '18 в 12:09
0 ответов

nvcc fatal: неподдерживаемая архитектура GPU 'compute_52' - сборка OpenCV 2.5

Я не могу скомпилировать OpenCV 2.5 на Red Hat 7.1 уже пробовал различные варианты cmake, такие как: cmake -D BUILD_TIFF = ON -D CUDA_GENERATION = Авто../ cmake -D BUILD_TIFF=ON -D WITH_CUDA=OFF ../ Вот вывод терминала: Scanning dependencies of targ…
31 окт '17 в 13:33
0 ответов

Qt и cuda, ошибка в режиме отладки

Я пытаюсь использовать CUDA для кода Qt; он отлично работает в выпуске, но не в отладке, где у меня есть следующее предупреждение: Это не похоже на отладочную сборку. Установка точек останова по имени файла и номеру строки может быть неудачной. В ос…
29 авг '18 в 06:43