Описание тега gpu-programming

См. Запись тега для [tag:gpu].
1 ответ

Переход от многопоточной программы к ЦПУ на C++

Я создал программу, которая должна вызывать функцию несколько раз (много!!) с разными входными параметрами. Чтобы ускорить процесс, я использовал многопоточность так: std::vector< MTDPDS* > mtdpds_list; boost::thread_group thread_gp; for (size…
21 июл '17 в 16:46
2 ответа

iOS: почему переопределение drawRect прибегает к программному рендерингу?

Я не большой поклонник графических API-интерфейсов iOS и их документации и уже некоторое время пытаюсь сформировать высокоуровневое представление и структуру процесса рендеринга, но имею только кусочки информации. По сути, я пытаюсь понять (опять же…
2 ответа

Странная ошибка при использовании cudaMemcpy: cudaErrorLaunchFailure

У меня есть код CUDA, который работает как показано ниже: cpyDataGPU --> CPU while(nsteps){ cudaKernel1<<<,>>> function1(); cudaKernel2<<<,>>> } cpyDataGPU --> CPU И функция1 такая: function1{ cudaKernel3&lt…
24 апр '12 в 20:43
2 ответа

Ускорит ли CUDA перемещение большого количества данных из листов Excel в базу данных?

Я разрабатываю программу, которая перемещает много данных из таблиц Excel в базу данных. Возможно ли что-то вроде CUDA ускорить процесс? Могу ли я использовать его, чтобы открывать более одного листа одновременно и иметь разные ядра, разделяющие раб…
06 янв '11 в 20:54
4 ответа

Разработка с OpenCl на ATI и Nvidia одновременно

Наша рабочая группа медленно пробует немного OpenCl в стороннем проекте. Пока что "все" работают над NVIDIA Quadro FX 580. Теперь мы планируем купить новые компьютеры для новых колледжей, и вместо FX 580 мы могли бы вместо этого купить ATI FirePro V…
02 ноя '10 в 16:55
1 ответ

Ошибка памяти в программе CUDA для графического процессора Fermi

Я сталкиваюсь со следующей проблемой на GPU GeForce GTX 580 (Fermi-class). Просто, чтобы дать вам некоторое представление, я читаю однобайтовые сэмплы, упакованные в файл следующим образом: Реальный (Сигнал 1), Воображаемый (Сигнал 1), Реальный (Сиг…
20 июл '11 в 22:37
3 ответа

Поэлементные операции в OpenCL (Cuda)

Я строю ядро ​​для поэлементного умножения двух матриц, но по крайней мере с моими конфигурациями мое ядро ​​OpenCL работает быстрее только тогда, когда каждая матрица больше 2 ГБ. Поэтому мне было интересно, если это из-за моего наивного ядра (см. …
18 май '11 в 13:26
3 ответа

Отладка OpenCL с помощью NVIDIA Nsight 2.1 и Visual Studio 2010

Насколько я знаю, Nvidia Nsight 2.1 дает возможность отлаживать код OpenCL. Я выполнил все требования Nsight Monitor (отключить WDDM, отключить aero, установить драйверы разработки, подключиться ко второй видеокарте), но все еще не могу отладить сво…
28 фев '12 в 08:02
0 ответов

Параллельное программирование на python, разгрузка на GPU

На мой взгляд, я пишу научный код на Python, содержащий множество очень параллелизуемых циклов for. В этих циклах я вызываю множество функций, принадлежащих классам, из библиотеки python2.7 с открытым исходным кодом, поэтому невозможно было бы перей…
1 ответ

Каков наилучший подход к использованию видеокарты в Java для "новичка"

Я студент в области компьютерной инженерии и работаю над игровым движком и небольшой игрой, которая будет построена на его основе. По мере того, как мы добавляем все больше и больше в проект, становится все яснее, что мы не сможем рендерить все, что…
20 сен '18 в 22:51
0 ответов

Failed NumPy array broadcasting with Numba

Numba has a @guvectorize decorator that can compile Python code into a generalized ufunc to run on GPU. So here I have such a function: @guvectorize([(float32[:,:], float32[:], float32[:])], '(m, n), (f)->(f)', target='cuda') def getVolSpaceGpu(i…
20 июл '18 в 07:28
0 ответов

Как заставить код Python работать на вашем GPU?

Я сделал скрипт Python для сравнения всех строк файла с одной строкой. Если строка равна строке, она печатает "найдено", например string = "jeff" for line in file: if line == string: print "found" break Единственная проблема с этим, если у вас есть …
16 ноя '15 в 22:18
1 ответ

Можно ли программировать на GPU, если у меня встроенная видеокарта?

У меня есть ноутбук HP Pavilion, его так называемая видеокарта - это своего рода интегрированный драйвер NVIDIA, работающий на общей памяти. Чтобы дать вам представление о его возможностях, если видеоигра была создана за последние 5 лет стоимостью б…
06 авг '10 в 06:49
2 ответа

Двусмысленность событий OpenCL

Ссылаясь на документацию clGetEventProfilingInfo, cl_event Результатом clEnqueueNDRangeKernel может быть: CL_PROFILING_COMMAND_QUEUED когда команда, указанная в событии, ставится в очередь в очередь команд хостом. CL_PROFILING_COMMAND_SUBMIT когда к…
07 окт '16 в 19:20
1 ответ

Противоречие cublasDgetrfBatched и cublasDtrsmBatched, когда нужно решать массив линейных систем с использованием cuBLAS

У меня много плотных линейных систем, которые я хочу решить в пакетном формате cuBLAS. Так что мой план использовать cublasDgetrfBatched для пакетной декомпозиции LU Затем используйте cublasDtrsmBatched для пакетной нижней треугольной и пакетной вер…
24 окт '17 в 19:13
1 ответ

CAFFE: ошибка Cuda "(8 против 0) недопустимая функция устройства" при использовании графического процессора (GeForce GTX 970)?

Я пытаюсь запустить сеть CNN "CAFFE" на GTX 970. Но я получаю ошибку, упомянутую в названии. Может кто-нибудь помочь? Я опубликовал проблему с более подробной информацией о группе кафе, но не получил никаких подсказок / ответов! https://groups.googl…
22 окт '15 в 08:29
0 ответов

Оптимизация обхода BVH с помощью графического процессора

Я создал ограничивающую иерархию томов, которая генерируется каждый кадр. Из-за его использования каждый узел должен иметь двух дочерних элементов, ни больше, ни меньше. Обход - единственное самое дорогое вычисление для моей программы на данный моме…
1 ответ

Компилирование opencv с поддержкой gpu cuda

Я использую OpenCV 2.3.1 с CUDA 4.0. Я установил OpenCV 2.3.1 от CMAKE с включенным флагом WITH_CUDA. Затем я скомпилировал решение OpenCV в режиме выпуска и отладки, но все же, когда использовал getCudaEnabledDevice функция CV::GPU он возвращает 0.…
16 май '12 в 07:22
2 ответа

GPU скрывает время доступа к памяти

Я знаю, что графические процессоры обычно имеют высокое время доступа к памяти. Тем не менее, производительность не сильно ограничена, так как время доступа "скрыто", выполняя другие инструкции в ожидании доступа к памяти. Мне просто интересно, если…
05 май '11 в 15:02
0 ответов

Проблема с графическим процессором NVIDIA для матричных операций

Я столкнулся с проблемой с моим простым ядром для сложного умножения матриц, вот оно: __kernel void myGEMMcomplex(__global double2* A, __global double2* B,__global double2* C, int rowsB, int colsB, int rowsA) { int globalRow = get_global_id(0); int …
02 янв '16 в 21:16