Описание тега opencl

OpenCL (Open Computing Language) - это среда для написания программ, которые выполняются на разнородных платформах, состоящих из ЦП, ГП и других процессоров.
2 ответа

Почему я не могу правильно скопировать данные в структуре в буфер openCL cl_mem?

Хорошо, я выделил это на очень специфическую проблему. У меня сложилось впечатление, что вы можете передавать OpenCL данные любого типа в буфер массива; целые числа, символы, ваши собственные пользовательские структуры, если они были всего лишь данн…
06 окт '11 в 13:58
2 ответа

Частичная инкапсуляция OpenCL, вызывающая ошибку сегментации, включая пример кода

Это полностью сбивает меня с толку. Два набора кода, которые должны быть логически одинаковыми, один падает только на графическом процессоре, в то время как оба нормально работают на процессоре. Вот тестовый код: #include <iostream> #include &…
04 ноя '13 в 17:52
1 ответ

На каком оборудовании работает OpenCL на процессорах Intel Core?

Я думаю о возможностях параллелизма, комбинируя OpenCL и AVX на платформах Intel i7, но я не думаю, что это возможно. Хотя я понимаю, что процессор и iGPU имеют одинаковую пропускную способность памяти, но я не уверен, что они используют другое обор…
17 мар '17 в 01:35
0 ответов

clGetProfilingEventInfo: Как получить информацию о множественном профилировании?

Я хотел бы получить информацию о профилировании. Моя очередь команд уже включена для профилирования. Это мой код: status = clEnqueueNDRangeKernel( commandQueue, kernl, 2, NULL, globalThreads, localThreads, 0, NULL, &ndrEvt); CHECK_OPENCL_ERROR(s…
24 июл '14 в 20:46
1 ответ

"Группировка" нескольких вызовов async_work_group_copy() с одним событием

Прав ли я, что следующая цитата из стандарта OpenCL 1.1 (раздел 6.11.10) Аргумент события может также использоваться для связывания async_work_group_copy с предыдущей асинхронной копией, позволяющей событию быть разделенным несколькими асинхронными …
3 ответа

Какова архитектура графических процессоров AMD/ATI Radeon серии 6000?

Смотри вопрос. Я могу найти документацию по сериям 5000 и 7000, но никаких заметок по сериям 6000 нет. Это полезно для попытки приблизиться к теоретической максимальной пропускной способности с OpenCL. До сих пор я нашел руководство по программирова…
06 июл '12 в 01:09
1 ответ

Поддерживает ли Mountain Lion OpenCL 1.2?

Я использую Mavericks для написания кода OpenCL, который должен быть совместим с 10.8 и 10.9 (Mavericks). Какие версии OpenCL поддерживаются в Mountain Lion?
05 фев '14 в 07:01
0 ответов

pyopencl ставит ядро ​​в очередь, чтобы создать только один рабочий элемент на строку в 2d буфере

Как правильно представить 2D-изображение в pyopencl, но поставить в очередь только один рабочий элемент на строку, а не один рабочий элемент на пиксель? Кажется, что ndrange хочет сделать по одному элементу для каждого пикселя или пиксельного компон…
15 июн '18 в 21:28
1 ответ

Сбой OpenCL при динамическом линковании?

Я пытаюсь загрузить библиотеку OpenCL во время выполнения, чтобы один и тот же исполняемый файл мог работать на платформах, на которых нет драйверов OpenCL, без поиска неразрешенных символов. Я использую Qt для этого, но я не думаю, что столкнулся с…
08 мар '14 в 08:05
2 ответа

Передача структуры в openCL Kernel

Я хочу передать структуру в ядро ​​opencl, структура struct test { int *x; float *y; char *z; }; и распределение памяти и инициализация похожи struct test t; t.x = (int*)malloc(sizeof(int)*100); t.y = (float*) malloc (sizeof(float)*50); t.z = (char*…
01 фев '13 в 10:57
1 ответ

Лучший способ сделать большое количество векторных вычислений с gpgpu?

У меня есть матрица 1 миллион столбцов х 1 миллион строк. Мой алгоритм должен сделать: Matrix m = Matrix(rows,cols) for (colB: cols){ vector currColA = m.getcolumn(colA) for (colB: cols){ vector currColB = m.getcolumn(colB) result = currColA.dotProd…
12 июн '12 в 15:59
2 ответа

Хранение ядра в отдельном файле - PyOpenCL

Я пытаюсь сохранить часть кода ядра с 3 """в другом файле. Я пытался сохранить его как текстовый файл и файл bin, и прочитать его, но не смог добиться успеха с этим. Это начало давать мне ошибку, говоря, что "" "отсутствует, или) отсутствует. "Однак…
22 сен '16 в 16:57
0 ответов

Ошибка сигнализации от ядра

Есть ли способ для ядра прервать очередь задач и преждевременно вернуть управление хосту, сбрасывая оставшиеся, но еще не обработанные задачи? Я передаю выходные массивы ядрам, размер которых заранее неизвестен. Я пытаюсь оценить размер, но если он …
20 фев '12 в 09:30
1 ответ

Регистры и частный буфер

В чем различия между регистрами и частной памятью в openCL.
28 мар '12 в 11:26
0 ответов

Блокировка не работает с OpenCL

Я застрял с проблемой в моем коде OpenCL, где я пытаюсь синхронизироваться внутри ядра: __kernel void pdiffs (__global const long2 *inData, __global const long2 *inData2, __global long2 *outData) { long2 diffSum = 0; uint idx0 = get_local_size(0)*ge…
10 июл '16 в 19:38
1 ответ

Байт-код OpenCL, запущенный на другой карте

У меня есть программа, которая использует OpenCL для расчета, код OpenCL большой и время компиляции составляет около 2 минут при 100% загрузке процессора. Конечно я сохраняю двоичные результаты компиляции. И второй запуск загрузки программы opencl и…
09 мар '14 в 06:27
2 ответа

Предлагает ли AMD OpenCL что-то похожее на CUDA GPUDirect?

NVIDIA предлагает GPUDirect для уменьшения накладных расходов при передаче памяти. Мне интересно, есть ли подобная концепция для AMD/ATI? В частности: 1) Избегайте ли графические процессоры AMD второй передачи памяти при взаимодействии с сетевыми ка…
15 фев '12 в 03:07
3 ответа

Тесла двойной точности

Я ищу информацию о том, как аппаратная реализация двойной точности реализована в Tesla GPU. Я читал, что два потоковых процессора работают над одним двойным значением, но я не нашел никакой официальной статьи от nvidia. Заранее спасибо. PPS Почему б…
11 авг '10 в 14:14
1 ответ

Может ли OpenCL на APU использовать всю память?

Можно ли собрать машину с чем-то вроде 32 ГБ ОЗУ и использовать около 28 ГБ с OpenCL? Мой текущий APU - Athlon 5350 с "глобальным объемом памяти", о котором сообщалось, 2142658560. Я немного поиграл с pyopencl с CL_MEM_USE_HOST_PTR, но я не нашел сп…
01 май '18 в 23:42
1 ответ

Использование async_work_group_copy с пользовательским типом данных

Мне нужно скопировать некоторые данные из __global в __local в openCL, используя async_work_group_copy. Проблема в том, что я не использую встроенный тип данных. Фрагмент кода того, что я пробовал, выглядит следующим образом: typedef struct Y { ... …
23 июн '16 в 02:41