Библиотеки CUDA Lapack (CULA & MAGMA) как функции устройства
Могут ли вызовы подпрограмм lapack в CUDA (CULA или MAGMA) создаваться в ядре CUDA, а не с хоста? (__device функции, а не __global функции) Если это невозможно, как реализовать подпрограммы (_device) линейной алгебры в CUDA? Моя цель - параллельно запустить в CUDA некоторые функции Lapack (sgesvd, sgesv..), и вызовы в моем приложении должны выполняться с устройства, а не с хоста.