Описание тега cudpp

1 ответ

Как использовать Cudpp без Cmake?

Мне нужно использовать функцию сканирования из cudpp. Тем не менее, cudpp требует cmake для компиляции. Есть ли способ использовать функцию сканирования из cudpp в C-код для CUDA напрямую? Если так, то как мне это сделать?
11 фев '13 в 02:03
1 ответ

Сегментированная сортировка с CUDPP/ тяга

Можно ли сделать сегментированную сортировку с CUDPP в CUDA? Под сегментированной сортировкой я подразумеваю сортировку элементов массива, которые защищены флагами, как показано ниже. A[10,9,8,7,6,5,4,3,2,1] Flag array[1,0,1,0,0,1,0,0,0,0] Сортирова…
20 окт '12 в 18:36
1 ответ

Уплотнение CUDA Stream: понимание концепции

Я использую CUDA/Thrust/CUDPP. Как я понимаю, при сжатии потока некоторые элементы в массиве помечаются как недействительные, а затем "удаляются". Теперь, что на самом деле означает "удаление"? Предположим, исходный массив A и имеет длину 6. Если 2 …
05 дек '11 в 16:01
1 ответ

Libcudpp.so отсутствует в CUDA 7.0?

Я использую jCuda и попытался скомпилировать и запустить один из его примеров (JCudppHashSample), доступный на jcuda в Ubuntu 14.04 с CUDA 7.0. Но во время компиляции библиотека jcudpp сообщает, что libcudpp недоступен. И мне интересно, это отсутств…
08 май '15 в 20:00
5 ответов

Сортировка объектов с помощью Thrust CUDA

Можно ли сортировать объекты с помощью библиотеки Thrust? У меня есть следующая структура: struct OB{ int N; Cls *C; //CLS is another struct. } Можно ли использовать тягу для сортировки массива OB по N? Можете ли вы привести простой пример использов…
12 мар '11 в 10:46
0 ответов

Производительность радикальной сортировки на графическом процессоре K10

Я ищу быструю реализацию алгоритма сортировки на GPU для больших массивов (сотни M элементов). Я уже попробовал cudpp и получил от 450M до 500M 4-байтовых ключа + 4-байтовое поле в секунду. Это не выглядело плохо, однако все еще в том, что процессор…
15 мар '15 в 21:25
2 ответа

Высокопроизводительная функция суммирования / сканирования префиксов в CUDA, поиск тяги, альтернатива библиотеке cuDPP

Я ищу высокопроизводительную мультисканируемую / мульти-префиксную сумму (много строк в одном ядре) для моего проекта в CUDA. Я пробовал один из библиотеки Thrust, но он слишком медленный. Также вызывает сбой после компиляции с отладочными флагами n…
01 сен '13 в 16:06
1 ответ

OpenMPI CUDA и CUDPP

У меня есть программа MPI для распределения большого массива среди нескольких процессов в кластере. Каждый процесс вычисляет свою собственную сумму элементов массива и возвращает результат хосту. Я хочу запустить параллельное сканирование префиксов …
24 апр '12 в 10:04
1 ответ

Алгоритм в thrust/cudpp для поиска k-го наименьшего элемента

Я ищу реализацию алгоритма k-го наименьшего элемента в Thrust/ Cudapp. Я гуглил за это, но, похоже, не нашел его. Кто-нибудь знает, существует ли такой алгоритм? Я видел, что есть переупорядочение, но это не говорит, что kth самый маленький.
27 дек '11 в 20:27
1 ответ

Тяга против CUDPP

Для использования параллельных алгоритмов данных на GPU с CUDA есть две стандартные библиотеки, CUDPP и Thrust, которые реализуют сортировку, сокращение, сумму префикса и т. Д. Итак, каковы основные различия между библиотеками с точки зрения произво…
19 июл '12 в 14:43
1 ответ

Ошибка при использовании CUDPPHandle

Я работаю над CUDA как новичок и пытаюсь выполнить предварительно написанный код, компиляция выдает ошибку при каждом использовании CUDPPHandle... например void HPGMST() { //Reinitialize the ranking arrays, must be orig but this also works CUDA_SAFE…
07 мар '14 в 09:46
1 ответ

Работает ли cudpp только для устройств с определенной вычислительной способностью

Я хочу использовать cudpp. Мне интересно, если это работает только для устройств с определенными вычислительными возможностями? Если да, то какова нижняя граница? Я нашел это сообщение об ошибке в коде реализации их хеш-таблицы: "Ошибка в вызове cud…
04 фев '12 в 18:04
1 ответ

CUDPP быстрее, чем THRUST в сортировке? так что насчет структурных массивов?

У меня есть массив структур, и я хочу отсортировать их. Я использовал Thrust::sort, и он работает хорошо. Затем люди говорят мне, что CUDPP быстрее в сортировке, но я обнаружил, что невозможно сортировать структурные массивы прямо. Здесь они объясни…
16 сен '11 в 17:49
1 ответ

Cudppscan дает неправильный вывод, когда размер входных данных превышает 700000

Я использую CUDA cudppScan вычислить префикс-сумму массива элементов. Это хорошо, когда размер входных данных невелик. Но когда размер данных превышает 700 000, некоторые элементы выходных данных оказываются неправильными значениями. я делаю cudppSc…
25 июл '11 в 12:03