Сканирующий код OpenCL
Я ищу быструю реализацию сканирования (prefixsum) в OpenCL. Лучшее, что я нашел, - это Nvidia SDK, но он старый (2010). Кто-нибудь знает какие-либо другие реализации сканирования в OpenCL?
2 ответа
Решение
Существует несколько реализаций сканирования с открытым исходным кодом в OpenCL:
- CLOGS, библиотека для высокоуровневых операций поверх API OpenCL C++.
- Boost.Compute, библиотека C++ для вычислений на GPU для OpenCL.
- VexCL, библиотека шаблонов векторного выражения C++ для OpenCL / CUDA.
- Bolt, библиотека шаблонов C++, оптимизированная для графических процессоров.
Автор CLOGS написал статью, сравнивающую производительность операций сканирования (и сортировки) в этих реализациях.
Если ваше устройство поддерживает 2.0, используйте встроенные операции для этого.
/questions/26296141/opencl-parallelnoe-sokraschenie-bez-lokalnoj-pamyati/26296146#26296146
http://developer.amd.com/community/blog/2014/11/17/opencl-2-0-device-enqueue/