cuda-gdb Сообщение об ошибке

Я попытался отладить приложение CUDA с помощью cuda-gdb, но получил странную ошибку.

Я установил опцию -g -G -O0 построить мое приложение. Я мог запустить мою программу без cuda-gdb, но не получил правильный результат. Поэтому я решил использовать cuda-gdb, однако я получил следующее сообщение об ошибке при запуске программы с cuda-gdb

Error: Failed to read the valid warps mask (dev=1, sm=0, error=16).

Что это значит? Зачем sm=0 и в чем смысл error=16?

Обновление 1: я пытался использовать cuda-gdb для образцов CUDA, но это не помогло с той же проблемой. Я только что установил CUDA 6.0 Toolkit, следуя инструкциям NVIDIA. Это проблема моей системы?

Обновление 2:

  • ОС - CentOS 6.5
  • GPU
    • 1 Quadro 400
    • 2 Tesla C2070
    • Я использую только 1 графический процессор для своей программы, но у меня такое же сообщение об ошибке из любого выбранного графического процессора
  • Версия CUDA - 6.0
  • Драйвер графического процессора
    • Версия NVRM: модуль ядра NVIDIA UNIX x86_64 331.62 Ср 19 марта, 18:20:03 PDT 2014
    • Версия GCC: версия gcc 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC)

Обновление 3: я пытался получить больше информации в cuda-gdb, но получил следующие результаты

(cuda-gdb) info cuda devices Error: Failed to read the valid warps mask (dev=1, sm=0, error=16). (cuda-gdb) info cuda sms Focus not set on any active CUDA kernel. (cuda-gdb) info cuda lanes Focus not set on any active CUDA kernel. (cuda-gdb) info cuda kernels No CUDA kernels. (cuda-gdb) info cuda contexts No CUDA contexts.

2 ответа

Решение

На самом деле, эта проблема относится только к некоторым старым графическим процессорам NVIDIA (например, "Quadro 400", "GeForce GT220" или "GeForce GT 330M" и т. Д.).

В настройках Лиама Кима cuda-gdb должен нормально работать, задав переменную окружения "CUDA_VISIBLE_DEVICES", и разрешить запуск cuda-gdb на GPU Tesla C2070 специально. Т.е. $export CUDA_VISIBLE_DEVICES=0 (или 2) - точный индекс устройств CUDA можно найти, запустив пример cuda - "deviceQuery".

И теперь, эта проблема была исправлена, исправление будет доступно для разработчиков CUDA в следующем выпуске CUDA (он будет опубликован в начале июля 2014 года).

Это внутренний cuda-gdb ошибка. Вы должны сообщить об ошибке.

Можете ли вы попробовать установить инструментарий CUDA из пакета на сайте NVIDIA?

Другие вопросы по тегам