Описание тега cusolver
None Библиотека , которая является частью инструментария NVIDIA CUDA для ускорения различных плотных и разреженных операций, подобных LAPACK, на графических процессорах
1
ответ
Многочисленные ошибки определения функций cuSparse при связывании файлов CUDA в исполняемом файле
Мой проект состоит из пяти файлов CUDA: main.cu jacobian_kernel.cu hermite_kernel.cu cuSolver_LU.cpp Utilities.cu, последний из которых адаптирован из этого репозитория GitHub, вместе с его Utilities.h заголовочный файл; три заголовка args.h linear_…
28 ноя '16 в 23:15
2
ответа
Пакетное CUDA-решение разреженного Ax=b для различных b
У меня есть разреженная матрица A, и я бы хотел (направить) решение Ax=b. У меня есть около 500 векторов b, поэтому я хотел бы найти соответствующие 500 х. Я новичок в CUDA, поэтому я немного смущен тем, какие варианты у меня есть. cuSOLVER имеет па…
07 май '15 в 17:30
0
ответов
Производительность CUDA Cusolver
Я использую следующий код, который использует процедуру cusolverDnSgesvd, для расчета SVD. К сожалению, производительность намного ниже, чем у CPU, и когда я профилирую код, в отчете nvprof я вижу так много передач данных DtoH и HtoD (каждый передае…
18 окт '17 в 19:38
1
ответ
Имеет ли cuSolverDN или другая библиотека CUDA пакетную версию QR-разложения для плотных матриц для решения A*x = b?
Я пытаюсь решить A*x = b, где A имеет комплексные значения и является плотным. Я использовал метод cusolverDnCgeqrf() из библиотеки cuSolverDN, чтобы выполнить QR-разложение для одного линейного набора уравнений. Однако я хочу сделать это несколько …
14 июл '17 в 00:10
1
ответ
Компиляция моей программы CUDA с библиотеками, предоставленными в наборе инструментов
Я написал простую программу CUDA C++, имитирующую диффузию на 2D матрице. У меня возникли проблемы, когда я попытался использовать некоторые из библиотек, представленных в Toolkit. Я хотел бы заменить свое крайне неэффективное матричное транспониров…
19 мар '17 в 09:54
1
ответ
Специальный способ обработки матриц с большим динамическим диапазоном для процедур cuSolverSp?
У меня есть матрицы, подобные той, что по этой ссылке: https://www.dropbox.com/s/tte3rlfsrprgtt8/ExampleMatrix.txt?dl=0 Этот пример представляет собой разреженную матрицу 9x9, где значения элементов значительно различаются по величине. Например, вел…
15 апр '16 в 19:03
1
ответ
CuSolver Разреженный интерфейс на Фортране
Я пытаюсь написать программу для интерфейса cusolverSp на Фортран. хотя я не новичок в кодировании cuda на C, я не уверен, как получить его на фортране. Вот мой код: ! Fortran Console Application ! module cuda_cusolverSP interface ! cudaMalloc integ…
09 фев '17 в 08:36
1
ответ
Расчет собственных значений и собственных векторов с помощью cusolver из cuda 7.0 RC
Я пытаюсь вычислить наибольшую пару собственных значений / собственных векторов с помощью cuSolver, выпущенного в CUDA 7.0 RC. Проблема в том, что я получаю CUSOLVER_INTERNAL_ERROR, и я не знаю, что я могу с этим поделать. Это мой удобный материал, …
07 мар '15 в 18:28
2
ответа
Вычисление особых значений только с CUDA
Я пытаюсь использовать новый cusolverDnSgesvd подпрограмма CUDA 7.0 для расчета особых значений. Полный код указан ниже: #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include<iostream> #include<st…
23 янв '15 в 10:13
1
ответ
CUDA 7.0, пример cuSolver: неразрешенное включение cudense.h
Я рассматриваю пример cuSolver в документации и получаю следующую ошибку: фатальная ошибка: cudense.h: нет такого файла или каталога Компиляция и компоновка, "make -n": nvcc -c -I / usr / local / cuda-7.0 / include main.cpp nvcc -o cusolver_run main…
31 авг '15 в 15:36
1
ответ
Ошибка сортировки образца CuSolverRf
У меня возникли проблемы с образцом CUSolverRf для решения разреженной матрицы 196530 x 196530 с матрицей 2530239 ннц. Я еще не пробовал со значениями вектора B (проблема в другой раз), и у меня уже есть ошибка: Ошибка (проверка сортировки столбца н…
17 авг '16 в 07:49
1
ответ
Используйте scikit-cuda для вычисления разложения по сингулярным значениям с помощью cuSOLVER
Я пытаюсь использовать оболочки Scikit-Cuda для функций cuSOLVER, в частности, я хочу выполнить cusolverDnSgesvd для вычисления SVD полной матрицы с одинарной точностью на матрице действительных чисел. Используя код здесь и здесь в качестве ссылки, …
30 окт '15 в 10:45
1
ответ
Cuda Cusolver не может связать в Visual Studio 2013
Я попробовал в основном все, и я не могу получить vs2013 для компиляции и ссылки на библиотеку cusolver. Я перепробовал все примеры проектов, поставляемые с установочным пакетом cuda, и в основном все примеры работают нормально. Хотя нет образцов, и…
23 май '15 в 22:51
1
ответ
Решение плотных линейных систем AX = B с помощью CUDA
Могу ли я использовать новую библиотеку cuSOLVER (CUDA 7) для решения линейных систем вида AX = B где A, X а также B являются NxN плотные матрицы?
01 мар '15 в 13:20
1
ответ
Огромное использование cudaFree из решателя трехдиагональной cuSparse
Я использую cusparseDgtsv_nopivot функция для решения трехдиагональной системы уравнений. вывод правильный, но функция не использует cuda multi-streaming. Профилировщик nvvp показывает, что, хотя каждый вызов этого решателя находится в отдельном пот…
19 янв '17 в 16:26
1
ответ
Функция ортонормирования Лапака для прямоугольной матрицы
Мне было интересно, есть ли в Лапаке функция для ортонормирования столбцов очень высокой и тощей матрицы. Аналогичный предыдущий вопрос задавал этот вопрос, предположительно в контексте квадратной матрицы. Моя настройка следующая: у меня есть матриц…
06 мар '16 в 09:34
1
ответ
Я не нахожу разложение LU на устройстве с cuSolver
Мне нужно вычислить определитель матрицы (массив двойной) с CUDA, и я хочу использовать разложение LU, чтобы сделать это. Я не нахожу функцию устройства в cusolverSp.h но только функция хоста cusolverSpDcsrlsvluHost, Я смотрю в cuda 7.0 и cuda 7.5. …
27 авг '15 в 07:00
1
ответ
Ошибка сегментации в Pycuda при использовании библиотеки NVIDIA cuSolver
Я пытаюсь сделать оболочку pycuda, вдохновленную библиотекой scikits-cuda, для некоторых операций, представленных в новой библиотеке cuSolver от Nvidia, сначала мне нужно выполнить факторизацию LU с помощью cusolverDnSgetrf () op. но перед этим мне …
21 апр '15 в 15:11
1
ответ
Не удалось выделить образец состояния cuSolverRf
Запуск образца CuSolverRf с образцом .mtx файлы lap2D_5pt_n100.mtx а также lap3D_7pt_n20.mtx позволяет программе работать без сбоев. Тем не менее, когда я вставляю в свой .mtx файл, я получаю ошибку после шага 8: "Ошибка CUDA в cuSolverRF.ccp:649 co…
22 авг '16 в 08:11
1
ответ
Лучший способ решения разреженных линейных систем в C++ - GPU Возможно?
В настоящее время я работаю над проектом, где нам нужно решить |Ax - b|^2, В этом случае, A это очень разреженная матрица и A'A имеет не более 5 ненулевых элементов в каждом ряду. Мы работаем с изображениями и размером A'A является NxN где N - колич…
08 фев '17 в 14:48