Извлечь верхнюю треугольную матрицу из результата "magma_dgeqrf2_gpu" (которая является общей матрицей) без передачи на хост
Я собираю ядро, которое, помимо прочего, использует функцию Magma magma_dgeqrf2_gpu для выполнения QR-факторизации. Это выводит верхнюю треугольную матрицу R в общую матрицу d_A на устройстве GPU.
Без передачи d_A обратно на хост (поскольку мне нужен графический процессор для дальнейших операций), существует ли либ-способ просто уменьшить или извлечь d_A в верхнюю треугольную матрицу R на устройстве?
1 ответ
Решение
Это немного глупо, но я обнаружил, что решение было просто использовать magmablas_dlacopy() и установить атрибуты для копирования верхней треугольной матрицы в другую матрицу (которая была установлена в 0) на устройстве.