Можно ли вызывать процедуры CULA из ядер устройств?
Поэтому я пытаюсь понять, смогу ли я получить какое-то существенное ускорение от использования графического процессора для решения небольшой переопределенной системы уравнений, решая кучу одновременно. Мой текущий алгоритм включает использование функции декомпозиции LU из библиотеки CULA Dense, которая также должна переключаться между графическим процессором и процессором для инициализации и запуска функций CULA. Я хотел бы иметь возможность вызывать функции CULA из моих ядер CUDA, чтобы мне не приходилось возвращаться к процессору и копировать данные обратно. Это также позволило бы мне создать несколько потоков, работающих с разными наборами данных, для одновременного решения нескольких систем. У меня вопрос, могу ли я вызывать функции CULA из функций устройства? Я знаю, что это возможно с CUBLAS и некоторыми другими библиотеками CUDA.
Спасибо!
1 ответ
Краткий ответ: нет. Подпрограммы библиотеки CULA предназначены для вызова из кода хоста, а не из кода устройства.
Обратите внимание, что у CULA есть свои собственные форумы поддержки, которые могут вас заинтересовать.