Описание тега gpgpu
GPGPU - это аббревиатура области компьютерных наук, известная как "Универсальные вычисления на графическом процессоре (GPU)".
2
ответа
Настройка NVIDIA VisionWorks в сообществе Visual Studio 2013
Кажется, у меня возникают трудности с настройкой VisionWorks, чтобы я мог использовать его с VS2013. Вот что я сделал до сих пор: Добавлено C:\Program Files\NVIDIA VisionWorks\include в C/C++ > Общие> Дополнительные каталоги включения Добавлено C:\P…
08 апр '16 в 11:05
1
ответ
Вычисление интегрального изображения на GPU действительно быстрее, чем на CPU?
Я новичок в вычислениях на GPU, так что, возможно, это действительно наивный вопрос.Я сделал несколько поисков, и кажется, что вычисление интегрального изображения на GPU - неплохая идея.Однако, когда я действительно копаюсь в этом, я задаюсь вопрос…
11 май '17 в 03:21
1
ответ
Могу ли я использовать в CUDA atomic-операции на удаленном GPU-RAM через GPUDirect 2.0 P2P?
Например, я могу использовать атомарные операции CUDA atomicAdd(ptr, val), atomicCAS(ptr, old, new),... на его глобальной памяти (GPU-RAM). С CUDA 6.5. Но могу ли я использовать эти атомарные операции для удаленной глобальной памяти через GPUDirect …
18 янв '15 в 18:47
2
ответа
Стратегии для выбора времени ядра CUDA: плюсы и минусы?
При синхронизации ядер CUDA следующее не работает, потому что ядро не блокирует выполнение программы CPU во время выполнения: start timer kernel<<<g,b>>>(); end timer Я видел три основных способа (успешно) синхронизировать ядра C…
03 дек '12 в 01:51
1
ответ
"Группировка" нескольких вызовов async_work_group_copy() с одним событием
Прав ли я, что следующая цитата из стандарта OpenCL 1.1 (раздел 6.11.10) Аргумент события может также использоваться для связывания async_work_group_copy с предыдущей асинхронной копией, позволяющей событию быть разделенным несколькими асинхронными …
17 мар '17 в 13:00
1
ответ
Как получить список видеокарт, к которым подключены мониторы?
Как получить список видеокарт, к которым подключены мониторы? Могу ли я получить список с параметрами: pciBusID, pciDeviceID, pciDomainID? ОС: Windows 7 Графические процессоры: nVidia GeForce/Quadro
04 сен '14 в 08:52
1
ответ
Лучший способ сделать большое количество векторных вычислений с gpgpu?
У меня есть матрица 1 миллион столбцов х 1 миллион строк. Мой алгоритм должен сделать: Matrix m = Matrix(rows,cols) for (colB: cols){ vector currColA = m.getcolumn(colA) for (colB: cols){ vector currColB = m.getcolumn(colB) result = currColA.dotProd…
12 июн '12 в 15:59
1
ответ
Можно ли сказать, какой указатель был выделен cudaMalloc, а какой - malloc?
Например, у меня есть указатель с плавающей точкой в коде хоста float *p Можно ли определить тип (устройство / хост) памяти, на который он указывает?
15 мар '15 в 16:13
0
ответов
GLSL для цикла для ошибки вычисления соседа сетки
Для небольшого фона это для выполнения столкновений частиц с текстурами поиска на GPU. Я прочитал текстуру положения с помощью javascript и создал текстуру сетки, которая содержит частицы, которые находятся в соответствующей ячейке сетки. Рабочий пр…
05 сен '17 в 18:40
3
ответа
Библиотека линейной алгебры с использованием OpenGL ES 2.0 для iOS
Кто-нибудь знает библиотеку линейной алгебры для iOS, которая использует OpenGL ES 2.0 под прикрытием? В частности, я ищу способ сделать матричное умножение на матрицах произвольного размера (например, намного больше, чем 4x4, больше как 5000 x 100 …
11 янв '13 в 23:07
1
ответ
Ускорение операции сокращения в Теано
Редактировать:Извините, оказалось, что на моем GPU были запущены другие процессы, пока я проводил тестирование, я обновил результаты синхронизации на свободном GPU, и ускорение становится заметным для больших матриц. Исходное сообщение: Как написано…
04 янв '16 в 08:34
1
ответ
Не все рабочие элементы используются opencl
Поэтому я могу скомпилировать и запустить свое ядро, проблема в том, что используются только два рабочих элемента. Я в основном пытаюсь заполнить массив с плавающей точкой [8] с помощью {0,1,2,3,4,5,6,7}. Так что это очень простое приложение Hello W…
07 май '15 в 03:32
1
ответ
LLVM преобразовывает константу в значение
Я использую пользовательский проход LLVM, где, если я сталкиваюсь с хранилищем, куда компилятор преобразует значение в константу; например, есть явное хранилище: X[gidx] = 10; Тогда LLVM сгенерирует эту ошибку: aoc: ../../../Instructions.cpp:1056: v…
31 мар '14 в 15:50
1
ответ
Загружается ли код функции ядра CUDA в GPU-RAM сразу или для каждого обращения к ней?
Загружается ли исполняемый код функции ядра CUDA в GPU сразу при запуске программы, или код загружается каждый раз при вызове функции ядра? Или в каких случаях может быть так или иначе? Это может сильно повлиять на выбор методов программирования: Мн…
10 окт '13 в 19:23
2
ответа
Хороший алгоритм сжатия без потерь для небольшого объема данных?
Я ищу хороший алгоритм сжатия без потерь, который может очень быстро сжимать / распаковывать небольшие объемы данных, такие как 256 операций с плавающей точкой, которые находятся между 0 и 1. Я знаю RLE, но, возможно, есть что-то лучше. Фоном являет…
11 фев '14 в 08:58
2
ответа
Высокая точность вывода из шейдера GLES2
Я делаю кое-что из GPGPU на платформе GLES2, которая поддерживает максимальное количество целей рендеринга RGBA8 (iOS). Мне нужно вывести vec2 в диапазоне +/- 2.0 с максимально возможной точностью, поэтому я пытаюсь упаковать каждый компонент в два …
13 июл '11 в 22:29
3
ответа
Есть ли библиотека Java для ускоренных векторных вычислений?
Я ищу библиотеку Java, которая позволяет делать некоторые быстрые вычисления с вектором (и, возможно, матрицы тоже). Под быстрым я подразумеваю, что он использует преимущества обработки GPU и / или инструкций SSE. Мне интересно, можно ли найти что-т…
08 дек '10 в 13:11
1
ответ
Копирование пикселей непосредственно в память GPU с помощью PBO в OpenGL ES 2.0
Я прочитал, что должна быть возможность передавать пиксельные данные непосредственно в память графического процессора, используя объекты пиксельного буфера. Что я не понимаю, так это если PBO поддерживается в OpenGL ES 2.0. Я нашел непоследовательну…
10 дек '11 в 09:58
1
ответ
Компиляция кода наследуемого класса и *.cu устройства
Простите, если это нетривиально. У меня есть небольшой класс, оборачиваясь cusp::csr_matrix<int,float,cusp::device_memory> вот так: class CuspMatrix : public cusp::csr_matrix<int,float,cusp::device_memory> { ... } Пока что я не делаю нич…
05 июл '13 в 04:02
2
ответа
Идеальное хеширование для OpenCL
У меня есть набор (статический, известный во время компиляции) около 2 миллионов значений по 20 байтов каждое. Мне нужен быстрый O(1) способ проверить, находится ли заданное значение в этом наборе. Кажется, что идеальная хеш-функция с битовым массив…
24 июн '12 в 11:13