Описание тега gpu-programming
См. Запись тега для [tag:gpu].
1
ответ
Переход от многопоточной программы к ЦПУ на C++
Я создал программу, которая должна вызывать функцию несколько раз (много!!) с разными входными параметрами. Чтобы ускорить процесс, я использовал многопоточность так: std::vector< MTDPDS* > mtdpds_list; boost::thread_group thread_gp; for (size…
21 июл '17 в 16:46
2
ответа
iOS: почему переопределение drawRect прибегает к программному рендерингу?
Я не большой поклонник графических API-интерфейсов iOS и их документации и уже некоторое время пытаюсь сформировать высокоуровневое представление и структуру процесса рендеринга, но имею только кусочки информации. По сути, я пытаюсь понять (опять же…
10 июн '14 в 19:51
2
ответа
Странная ошибка при использовании cudaMemcpy: cudaErrorLaunchFailure
У меня есть код CUDA, который работает как показано ниже: cpyDataGPU --> CPU while(nsteps){ cudaKernel1<<<,>>> function1(); cudaKernel2<<<,>>> } cpyDataGPU --> CPU И функция1 такая: function1{ cudaKernel3<…
24 апр '12 в 20:43
2
ответа
Ускорит ли CUDA перемещение большого количества данных из листов Excel в базу данных?
Я разрабатываю программу, которая перемещает много данных из таблиц Excel в базу данных. Возможно ли что-то вроде CUDA ускорить процесс? Могу ли я использовать его, чтобы открывать более одного листа одновременно и иметь разные ядра, разделяющие раб…
06 янв '11 в 20:54
4
ответа
Разработка с OpenCl на ATI и Nvidia одновременно
Наша рабочая группа медленно пробует немного OpenCl в стороннем проекте. Пока что "все" работают над NVIDIA Quadro FX 580. Теперь мы планируем купить новые компьютеры для новых колледжей, и вместо FX 580 мы могли бы вместо этого купить ATI FirePro V…
02 ноя '10 в 16:55
1
ответ
Ошибка памяти в программе CUDA для графического процессора Fermi
Я сталкиваюсь со следующей проблемой на GPU GeForce GTX 580 (Fermi-class). Просто, чтобы дать вам некоторое представление, я читаю однобайтовые сэмплы, упакованные в файл следующим образом: Реальный (Сигнал 1), Воображаемый (Сигнал 1), Реальный (Сиг…
20 июл '11 в 22:37
3
ответа
Поэлементные операции в OpenCL (Cuda)
Я строю ядро для поэлементного умножения двух матриц, но по крайней мере с моими конфигурациями мое ядро OpenCL работает быстрее только тогда, когда каждая матрица больше 2 ГБ. Поэтому мне было интересно, если это из-за моего наивного ядра (см. …
18 май '11 в 13:26
3
ответа
Отладка OpenCL с помощью NVIDIA Nsight 2.1 и Visual Studio 2010
Насколько я знаю, Nvidia Nsight 2.1 дает возможность отлаживать код OpenCL. Я выполнил все требования Nsight Monitor (отключить WDDM, отключить aero, установить драйверы разработки, подключиться ко второй видеокарте), но все еще не могу отладить сво…
28 фев '12 в 08:02
0
ответов
Параллельное программирование на python, разгрузка на GPU
На мой взгляд, я пишу научный код на Python, содержащий множество очень параллелизуемых циклов for. В этих циклах я вызываю множество функций, принадлежащих классам, из библиотеки python2.7 с открытым исходным кодом, поэтому невозможно было бы перей…
15 окт '15 в 09:33
1
ответ
Каков наилучший подход к использованию видеокарты в Java для "новичка"
Я студент в области компьютерной инженерии и работаю над игровым движком и небольшой игрой, которая будет построена на его основе. По мере того, как мы добавляем все больше и больше в проект, становится все яснее, что мы не сможем рендерить все, что…
20 сен '18 в 22:51
0
ответов
Failed NumPy array broadcasting with Numba
Numba has a @guvectorize decorator that can compile Python code into a generalized ufunc to run on GPU. So here I have such a function: @guvectorize([(float32[:,:], float32[:], float32[:])], '(m, n), (f)->(f)', target='cuda') def getVolSpaceGpu(i…
20 июл '18 в 07:28
0
ответов
Как заставить код Python работать на вашем GPU?
Я сделал скрипт Python для сравнения всех строк файла с одной строкой. Если строка равна строке, она печатает "найдено", например string = "jeff" for line in file: if line == string: print "found" break Единственная проблема с этим, если у вас есть …
16 ноя '15 в 22:18
1
ответ
Можно ли программировать на GPU, если у меня встроенная видеокарта?
У меня есть ноутбук HP Pavilion, его так называемая видеокарта - это своего рода интегрированный драйвер NVIDIA, работающий на общей памяти. Чтобы дать вам представление о его возможностях, если видеоигра была создана за последние 5 лет стоимостью б…
06 авг '10 в 06:49
2
ответа
Двусмысленность событий OpenCL
Ссылаясь на документацию clGetEventProfilingInfo, cl_event Результатом clEnqueueNDRangeKernel может быть: CL_PROFILING_COMMAND_QUEUED когда команда, указанная в событии, ставится в очередь в очередь команд хостом. CL_PROFILING_COMMAND_SUBMIT когда к…
07 окт '16 в 19:20
1
ответ
Противоречие cublasDgetrfBatched и cublasDtrsmBatched, когда нужно решать массив линейных систем с использованием cuBLAS
У меня много плотных линейных систем, которые я хочу решить в пакетном формате cuBLAS. Так что мой план использовать cublasDgetrfBatched для пакетной декомпозиции LU Затем используйте cublasDtrsmBatched для пакетной нижней треугольной и пакетной вер…
24 окт '17 в 19:13
1
ответ
CAFFE: ошибка Cuda "(8 против 0) недопустимая функция устройства" при использовании графического процессора (GeForce GTX 970)?
Я пытаюсь запустить сеть CNN "CAFFE" на GTX 970. Но я получаю ошибку, упомянутую в названии. Может кто-нибудь помочь? Я опубликовал проблему с более подробной информацией о группе кафе, но не получил никаких подсказок / ответов! https://groups.googl…
22 окт '15 в 08:29
0
ответов
Оптимизация обхода BVH с помощью графического процессора
Я создал ограничивающую иерархию томов, которая генерируется каждый кадр. Из-за его использования каждый узел должен иметь двух дочерних элементов, ни больше, ни меньше. Обход - единственное самое дорогое вычисление для моей программы на данный моме…
06 сен '14 в 17:57
1
ответ
Компилирование opencv с поддержкой gpu cuda
Я использую OpenCV 2.3.1 с CUDA 4.0. Я установил OpenCV 2.3.1 от CMAKE с включенным флагом WITH_CUDA. Затем я скомпилировал решение OpenCV в режиме выпуска и отладки, но все же, когда использовал getCudaEnabledDevice функция CV::GPU он возвращает 0.…
16 май '12 в 07:22
2
ответа
GPU скрывает время доступа к памяти
Я знаю, что графические процессоры обычно имеют высокое время доступа к памяти. Тем не менее, производительность не сильно ограничена, так как время доступа "скрыто", выполняя другие инструкции в ожидании доступа к памяти. Мне просто интересно, если…
05 май '11 в 15:02
0
ответов
Проблема с графическим процессором NVIDIA для матричных операций
Я столкнулся с проблемой с моим простым ядром для сложного умножения матриц, вот оно: __kernel void myGEMMcomplex(__global double2* A, __global double2* B,__global double2* C, int rowsB, int colsB, int rowsA) { int globalRow = get_global_id(0); int …
02 янв '16 в 21:16