CULA (http://www.culatools.com/) - это библиотека линейной алгебры, использующая архитектуру NVIDIA CUDA. Как и в большинстве решений на базе графических процессоров, значительное увеличение скорости возможно для задач с высокой степенью распараллеливания.
1 ответ

culagesvd() в CULA

Я хочу использовать culadgesvd() функция для вычисления SVD для матрицы. Мне не ясно, как на самом деле использовать его в C/C++ с информацией в документации. Кто-нибудь может дать мне полную маленькую программу на C, шаблон, чтобы показать, как в о…
31 июл '13 в 07:12
1 ответ

CULA multiGPU.c

Я пытаюсь запустить пример multiGPU в CULA, но получаю следующую ошибку. Кто-то попробовал пример и сумел заставить его работать? У меня есть два графических процессора на борту. [xxxx @ xxxxxxxxxx multiGPU] $./multiGPU Найдено 2 устройства, будет з…
21 июл '14 в 18:58
2 ответа

Rcpp и CULA: ошибка сегментации

Я извлек соответствующие биты из R-пакета gputools для запуска QR-декомпозиции на моем GPU с использованием Rcpp путем динамической загрузки разделяемой библиотеки, которая ссылается на culatools. Все отлично работает в терминале и R.app на моем Mac…
29 июл '13 в 13:45
1 ответ

Как использовать 3D-матрицы с CULA на GPU?

Поэтому в настоящий момент в версии CPU для некоторого кода у меня есть много вещей, которые выглядят следующим образом: for(int i =0;i<N;i++){ dgemm(A[i], B[i],C[i], Size[i][0], Size[i][1], Size[i][2], Size[i][3], 'N','T'); } где A[i] будет двух…
30 май '13 в 14:10
2 ответа

Различные результаты разложения QR с NumPy и CULA

Я выполняю QR-декомпозицию двумя различными способами: используя стандартный метод numpy и используя функцию GEQRF LAPACK, реализованную в библиотеке CULA. Вот простой пример в Python (PyCULA используется для доступа к CULA): from PyCULA.cula import…
24 апр '14 в 13:22
1 ответ

MAGMA и Rcpp для линейной алгебры в R

Мне было интересно, пытался ли кто-нибудь использовать Rcpp и MAGMA для ускорения операций линейной алгебры в R с помощью CPU и GPU? В прошлом месяце я попробовал culatools, и он работал с Rcpp ( ссылка), но culatools - это коммерческий продукт, кот…
23 авг '13 в 11:43
0 ответов

Python CULA Sgesv Ax=B решает, но дает негативы для позитива? Зачем?

Я использую Python CULA Sgesv для решения матричной операции. Когда я сравниваю ответ из CULA с решением линейной алгебры, CULA возвращает правильные числа, но меняет знак числа. Поэтому, если реальное решение положительно, решение CULA отрицательно…
03 апр '15 в 13:19
1 ответ

Можно ли вызывать процедуры CULA из ядер устройств?

Поэтому я пытаюсь понять, смогу ли я получить какое-то существенное ускорение от использования графического процессора для решения небольшой переопределенной системы уравнений, решая кучу одновременно. Мой текущий алгоритм включает использование фун…
13 ноя '13 в 23:01
1 ответ

CUDA библиотека для вычисления продукта Kronecker

У меня есть приложение, которое требует, чтобы я вычислил несколько больших произведений Кронекера двумерных матриц и умножил результат на большие двумерные матрицы. Я хотел бы реализовать это на графическом процессоре в CUDA и предпочел бы использо…
17 янв '14 в 16:17
0 ответов

CULA: неопределенные ссылочные функции

Я скачал CULA Dense R17 Free Edition для Linux. Я заметил, что в каталогах lib и lib64 нет libcula_lapack.so, но есть только libcula_lapack_basic.so. Это должно быть нормально, потому что на сайте culatools указано, что в этой версии cula_lapack.dll…
27 фев '15 в 10:06
1 ответ

Theano: смешивать CPU и GPU?

Я построил нейронную сеть, которая должна использовать декомпозицию Холецкого и решать треугольные системы как часть ее вычисления. Это означает, что мне также, конечно, нужно вычислить градиенты всего вычисления. Когда я пытаюсь скомпилировать код,…
08 ноя '16 в 12:33
1 ответ

Прояснить кое-что о неосторожности

Проверяя этот пример (пример API в конце), я хочу задать несколько вопросов. 1) В примере мы поставляем матрицу a с ненулевыми элементами. Каков же реальный размер матрицы? И это элементы матрицы или позиции, которые содержат ненулевые элементы? 2) …
26 фев '14 в 11:36
1 ответ

CULA - использование Python solve() в CULA

Как я могу включить Python execute() в программу Python CULA? я использую LA = libculaC.solve() Результат: Traceback (most recent call last): File "culaTest.py", line 96, in <module> LA = libculaC.solve(0) File "/usr/lib/python2.7/ctypes/__ini…
12 мар '15 в 02:26
2 ответа

Загрузите плотную библиотеку CULA в python на плате jetson tk1

После успешной загрузки и установки полного пакета CULA плотность R18 с этого веб-сайта ( http://www.culatools.com/downloads/dense/) на мою плату Jetson TK1, я не смог загрузить библиотеку в python с использованием ctypes, Я изменил LD_LIBRARY_PATH …
18 сен '14 в 23:42
0 ответов

Cula рутина sgbtrf не определено

Когда я пытаюсь вызвать процедуру CULA GBTRF Я получаю этот идентификатор ошибки "culaSgbtrf" не определено, но все остальное (inizializaion, GetErrorInfoStrin и т. Д.,), Кажется, работает нормально. Кто-нибудь знает почему и может мне помочь?
05 окт '17 в 06:18
1 ответ

Как использовать устройство Cula

Я немного запутался в том, как использовать интерфейс устройства cula. Сейчас я использую интерфейс cula в файле cpp и генерирую случайные числа из файла cu. Cu файл: ... __global__ void kernel( double * A,double * B, curandState * globalState, int …
27 фев '14 в 09:22
1 ответ

cula использование culaSgels - неверный аргумент?

Я пытаюсь использовать функцию culaSgels для решения Ax=B. Я изменил пример systemSolve пакета cula. void culaFloatExample() { int N=2; int NRHS = 2; int i,j; double cula_time,start_time,end_time; culaStatus status; culaFloat* A = NULL; culaFloat* B…
12 фев '14 в 10:12
1 ответ

Как скопировать матрицу в большую матрицу в CUDA

Я хочу установить большую матрицу на моем графическом процессоре для решения соответствующей системы уравнений с помощью CULA. Некоторые цифры для вас, чтобы понять проблему: big matrix: 400x400 small matrices: 200x200 Теперь я хочу копировать кажды…
02 май '13 в 06:57
1 ответ

GPUMLib нерешенные внешние факторы во время сборки

Я пытаюсь построить GPUMLib, и я получаю следующие ошибки Error 11 error LNK2019: unresolved external symbol "public: static void __cdecl GPUMLib::Random::SetSeed(unsigned __int64,enum curandRngType)" (?SetSeed@Random@GPUMLib@@SAX_KW4curandRngType@@…
18 июл '13 в 19:27
0 ответов

Библиотеки CUDA Lapack (CULA & MAGMA) как функции устройства

Могут ли вызовы подпрограмм lapack в CUDA (CULA или MAGMA) создаваться в ядре CUDA, а не с хоста? (__device функции, а не __global функции) Если это невозможно, как реализовать подпрограммы (_device) линейной алгебры в CUDA? Моя цель - параллельно з…
01 мар '15 в 19:52