Сканирующий код OpenCL

Я ищу быструю реализацию сканирования (prefixsum) в OpenCL. Лучшее, что я нашел, - это Nvidia SDK, но он старый (2010). Кто-нибудь знает какие-либо другие реализации сканирования в OpenCL?

2 ответа

Решение

Существует несколько реализаций сканирования с открытым исходным кодом в OpenCL:

  • CLOGS, библиотека для высокоуровневых операций поверх API OpenCL C++.
  • Boost.Compute, библиотека C++ для вычислений на GPU для OpenCL.
  • VexCL, библиотека шаблонов векторного выражения C++ для OpenCL / CUDA.
  • Bolt, библиотека шаблонов C++, оптимизированная для графических процессоров.

Автор CLOGS написал статью, сравнивающую производительность операций сканирования (и сортировки) в этих реализациях.

Если ваше устройство поддерживает 2.0, используйте встроенные операции для этого.

/questions/26296141/opencl-parallelnoe-sokraschenie-bez-lokalnoj-pamyati/26296146#26296146

http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/

Другие вопросы по тегам