Вычислить матричное векторное умножение с питоном в cuda

Question

Вычислить матричное векторное умножение с питоном в cuda

Я пытаюсь использовать Numbapro, чтобы написать простое матричное векторное умножение ниже:

from numbapro import cuda
from numba import *
import numpy as np
import math
from timeit import default_timer as time

m = 100000 
n = 100

@cuda.jit('void(f4[:,:], f4[:], f4[:])')
def cu_matrix_vector(A, b, c):
    row = cuda.grid(1)
    if (row < m):
        sum = 0

        for i in range(n):
            sum += A[row, i] * b[i]

        c[row] = sum

A = np.array(np.random.random((m, n)), dtype=np.float32)
B = np.array(np.random.random(m), dtype=np.float32)
C = np.empty_like(B)

s = time()
dA = cuda.to_device(A)
dB = cuda.to_device(B)
dC = cuda.to_device(C)

cu_matrix_vector[(m+511)/512, 512](dA, dB, dC)

dC.to_host()

print ( C)

Но когда я начинаю работать, я получаю ошибку в функции **cu_matrix_vector ** аргумент 2: неправильный тип

cu_matrix_vector[(m+511)/512, 512](дА, дБ, дЦ) Файл "C:\Anaconda3\lib\site-packages\numba\cuda\compiler.py", строка 359, в вызове sharedmem=self.sharedmem) Файл "C:\Anaconda3\lib\site-packages\numba\cuda\compiler.py", строка 433, в _kernel_call cu_func(*kernelargs) Файл "C: \ Anaconda3 \ lib \ site-packages \ numba \ cuda" \cudadrv\driver.py", строка 1116, в вызове self.sharedmem, streamhandle, args) Файл"C:\Anaconda3\lib\site-packages\numba\cuda\cudadrv\driver.py", строка 1160, в launch_kernel Нет) Файл "C: \ Anaconda3 \ lib \ site-packages \ numba \ cuda \ cudadrv \ driver.py", строка 221, в safe_cuda_api_call retcode = libfn(*args) ctypes.ArgumentError: аргумент 2: неверный тип

0

python-3.x cuda numba numba-pro

Источник

user7716929 27 апр '17 в 09:03

1 ответ

Решение

Другие вопросы по тегам python-3.x cuda numba numba-pro

user681865 27 апр '17 в 09:49 2017-04-27 09:49 · Accepted Answer · 2017-04-27 09:49

Проблема заключается здесь:

cu_matrix_vector[(m+511)/512, 512](dA, dB, dC)

в Python 3, (m+511)/512 = 196.310546875, Передача значения с плавающей запятой в качестве параметра запуска недопустима, что является источником ошибки конфликта типов, которую вы видите. Ты хочешь сделать:

cu_matrix_vector[(m+511)//512, 512](dA, dB, dC)

которая выдаст целочисленное значение и должна позволить коду работать правильно.