Функция Cuda::Entry использует слишком много локальных данных
Я пытаюсь запустить один алгоритм для пересечения полигонов на Tesla C2075. Но когда я пытаюсь скомпилировать этот алгоритм, компилятор выдает мне ошибку:"Entry Function 'Polygon_Intersection'uses too much local data(0x40e8 bytes,0x4000)
,
Мой алгоритм немного сложен, и он использует много локальных переменных внутри ядра. Итак, мой вопрос: есть ли способ решить эту проблему, например, могу ли я использовать глобальную память для объявления локальной переменной для каждого ядра или как-то использовать разделяемую память?
1 ответ
Решение
Компилировать с -arch=sm_20
включить на стороне устройства malloc
так что вы можете использовать память кучи для локальных данных потока.