Функция Cuda::Entry использует слишком много локальных данных

Я пытаюсь запустить один алгоритм для пересечения полигонов на Tesla C2075. Но когда я пытаюсь скомпилировать этот алгоритм, компилятор выдает мне ошибку:"Entry Function 'Polygon_Intersection'uses too much local data(0x40e8 bytes,0x4000),

Мой алгоритм немного сложен, и он использует много локальных переменных внутри ядра. Итак, мой вопрос: есть ли способ решить эту проблему, например, могу ли я использовать глобальную память для объявления локальной переменной для каждого ядра или как-то использовать разделяемую память?

1 ответ

Решение

Компилировать с -arch=sm_20 включить на стороне устройства malloc так что вы можете использовать память кучи для локальных данных потока.

Другие вопросы по тегам