ISPC spmm работа с большими массивами

Я написал приведенное ниже ядро ​​в ispc для выполнения умножения плотной матрицы с разреженной матрицей (SpMM)

      // assume same number of rows and columns in the sparse matrix
export void __spmm_csr_ispc_naive(uniform int64 num_rows, // num_rows and columns in the sparse matrix
                            uniform int64 num_cols, // num_cols in the dense matrix
                            uniform int64 Ap[], // row pointers
                            uniform int32 Aj[], // column indices
                            uniform float Ax[], // values
                            uniform float B[],  // dense matrix
                            uniform float C[])  { // result matrix

    // foreach (i = 0 ... num_rows) {
    for (int64 i = 0; i < num_rows; i++) {
        int32 row_start = Ap[i];
        int32 row_end   = Ap[i+1];
        // for (int j = 0; j < num_cols; j++) {
        foreach (j = 0 ... num_cols) {
            float sum = 0.0f;
            for (int64 jj = row_start; jj < row_end; jj++) {            
                int32 k = Aj[jj];                     // column index
                int64 b_idx = k*num_cols + j;
                float aValue = Ax[jj];              // a mat value from column index
                float bValue = B[b_idx];
                sum += aValue * bValue;
            }
            int64 c_idx = i*num_cols + j;
            C[c_idx] = sum; 
        }
    }
}

Здесь разреженная матрица использует формат CSR (сжатая разреженная строка). Разреженная матрица имеет размеры (num_rows, num_rows) в плотном формате. Ap - это одномерный массив длиной num_rows+1, в то время как Aj и Ax - одномерные массивы num_rows * num_rows * 0.1, потому что я создаю разреженную матрицу с разреженностью 10%

Кажется, ядро ​​работает для значений num_rows, равных 70000 и ниже, но код выдает ошибку ошибки сегментации, когда я пытаюсь сделать num_rows равным 75000 или выше. Поскольку я использую int64 для индексов массива, я не уверен, что делаю здесь неправильно. Приветствуется любая помощь в решении этой проблемы.

0 ответов

Другие вопросы по тегам