ОШИБКА: ядро ​​SYCL не может вызывать через указатель функции, DPCPP, TBB

Я пытаюсь определить массив функций и перейти к карте, которую я определил как класс, тогда, если мое устройство является ЦП, выполнение каждой из моих функций по вектору проходит через ЦП, в противном случае - через SYCL часть и выполнить на GPU. В то же время я хочу измерить производительность своего кода, производительность выполнения моего кода на ЦП с библиотекой TBB. Проблема в том, что когда я компилирую свою программу, она показывает мне эту ошибку, и я не знаю, как ее исправить. Я должен указать, что перед определением массива функций с определением локальной копии функции в части SYCL мой код работает хорошо, и я получил результат, но после определения массива функций он выдает ошибку. мой код:

          #include <CL/sycl.hpp>
#include <iostream>
#include <tbb/tbb.h>
#include <tbb/parallel_for.h>
#include <vector>
#include <string>
#include <queue>
#include<tbb/blocked_range.h>
#include <tbb/global_control.h>
#include <chrono>


using namespace tbb;

template<class Tin, class Tout, class Function>
class Map {
private:
    Function fun;
public:
    Map() {}
    Map(Function f):fun(f) {}


    std::vector<Tout> operator()(bool use_tbb, std::vector<Tin>& v) {
        std::vector<Tout> r(v.size());
        if(use_tbb){
            // Start measuring time
            auto begin = std::chrono::high_resolution_clock::now();
            tbb::parallel_for(tbb::blocked_range<Tin>(0, v.size()),
                        [&](tbb::blocked_range<Tin> t) {
                    for (int index = t.begin(); index < t.end(); ++index){
                        r[index] = fun(v[index]);
                    }
            });
            // Stop measuring time and calculate the elapsed time
            auto end = std::chrono::high_resolution_clock::now();
            auto elapsed = std::chrono::duration_cast<std::chrono::nanoseconds>(end - begin);
            printf("Time measured: %.3f seconds.\n", elapsed.count() * 1e-9);
            return r;
         } else {
                sycl::queue gpuQueue{sycl::gpu_selector()};
                sycl::range<1> n_item{v.size()};
                sycl::buffer<Tin, 1> in_buffer(&v[0], n_item);
                sycl::buffer<Tout, 1> out_buffer(&r[0], n_item);
                gpuQueue.submit([&](sycl::handler& h){
                    //local copy of fun
                    auto f = fun;
                    sycl::accessor in_accessor(in_buffer, h, sycl::read_only);
                    sycl::accessor out_accessor(out_buffer, h, sycl::write_only);
                    h.parallel_for(n_item, [=](sycl::id<1> index) {
                        out_accessor[index] = f(in_accessor[index]);
                    });
                }).wait();
         }
                return r;
    }
};

template<class Tin, class Tout, class Function>
Map<Tin, Tout, Function> make_map(Function f) { return Map<Tin, Tout, Function>(f);}


typedef int(*func)(int x);
//define different functions
auto function = [](int x){ return x; };
auto functionTimesTwo = [](int x){ return (x*2); };
auto functionDivideByTwo = [](int x){ return (x/2); };
auto lambdaFunction = [](int x){return (++x);};

int main(int argc, char *argv[]) {

    std::vector<int> v = {1,2,3,4,5,6,7,8,9};

    //Array of functions
    func functions[] =
        {
            function,
            functionTimesTwo,
            functionDivideByTwo,
            lambdaFunction
        };
    for(int i = 0; i< sizeof(functions); i++){
        auto m1 = make_map<int, int>(functions[i]);
        std::vector<int> r = m1(true, v);
        //print the result
        for(auto &e:r) {
            std::cout << e << " ";
         }
    }
    

  return 0;
}

Ошибка:

      SYCL kernel cannot call through a function pointer

3 ответа

Вы не должны забывать, что вы нацеливаетесь на различные устройства, каждое из которых выполняет свою собственную версию вашей функции.

Во-первых, использование указателя функции не имеет смысла, поскольку он имеет только одно значение и не может представлять версию одной и той же функции как для CPU, так и для GPU.

Во-вторых, если вы используете функцию, которая не является составной для получения указателей на функции, и вы используете модель программирования, которая не требует объявления вашей функции как ядра (например, CUDA), тогда я не понимаю, как компилятор может определить, какие функции компилировать для различных устройств.

Вы не можете. Цитата из спецификации SYCL 2020 :

Код устройства SYCL, как определено в этой спецификации, не поддерживает вызовы виртуальных функций, указатели на функции в целом, исключения, информацию о типе времени выполнения или полный набор библиотек C++, которые могут зависеть от этих функций или от функций конкретного компилятора хоста.

Я решил свою проблему с помощью этой ссылки:https://github.com/intel/pti-gpu с помощью флага openCL.

Другие вопросы по тегам