Описание тега cuda-context
Контекст CUDA содержит информацию о состоянии для управления вычислительной работой на устройстве CUDA, включая выделение памяти, загруженные модули кода, сопоставления областей памяти и т. Д.
0
ответов
Как реализовать дескрипторы для библиотеки API драйвера CUDA?
Примечание: вопрос был обновлен, чтобы ответить на вопросы, которые были подняты в комментариях, и подчеркнуть, что суть вопроса заключается в взаимозависимостях между API времени выполнения и драйвера Библиотеки времени выполнения CUDA (такие как C…
08 фев '18 в 01:19
1
ответ
Несколько контекстов CUDA для одного устройства - какой смысл?
Я думал, что у меня это есть, но, видимо, нет:) Мне нужно выполнить параллельное потоковое кодирование H.264 с NVENC из кадров, которые не находятся ни в одном из форматов, принятых кодировщиком, поэтому у меня есть следующий конвейер кода: Обратный…
30 апр '15 в 09:48
1
ответ
Контекст CUDA был создан на графическом процессоре, который в настоящее время не может быть отлажен
Когда я начинаю отладку cuda, Nsight возвращает эту ошибку: Контекст CUDA был создан на графическом процессоре, который в настоящее время не может быть отлажен. Точки останова будут отключены. Адаптер: GeForce GT 720M Это моя система и информация CU…
26 мар '17 в 14:51
1
ответ
Когда основной контекст CUDA уничтожается Runtime API?
В этом обсуждении среды выполнения и API драйвера говорится, что Первичные контексты создаются по мере необходимости, по одному на устройство на процесс, подсчитываются ссылки и затем уничтожаются, когда на них больше нет ссылок. Что считается таким…
30 апр '20 в 13:35
1
ответ
Могут ли несколько процессов использовать один контекст CUDA?
Этот вопрос является продолжением комментария Джейсона Р. к ответу Роберта Кровелласа на этот исходный вопрос ("Несколько контекстов CUDA для одного устройства - какой смысл?"): Когда вы говорите, что несколько контекстов не могут выполняться одновр…
07 ноя '19 в 14:00
2
ответа
Как уменьшить размер контекста CUDA (многопроцессорная служба)
Я последовал за Робертом Crovella в пример о том, как использовать от Nvidia Multi-Process Service. Согласно документам: 2.1.2. Уменьшенное хранилище контекста на GPU Без MPS каждый процесс CUDA с использованием графического процессора выделяет отде…
19 дек '19 в 17:21
1
ответ
Как я могу определить, является ли контекст CUDA основным - дешево?
Вы можете (?) Определить, является ли контекст CUDA основным, вызвав cuDevicePrimaryCtxRetain() и сравнивая возвращенный указатель с имеющимся у вас контекстом. Но - что, если первичный контекст еще никто не создал? Тогда есть ли более дешевый спосо…
13 июл '20 в 01:55
0
ответов
Связаны ли сопоставления и выделения виртуальной памяти CUDA с контекстом?
Ни один из API виртуальной памяти CUDA (представленных в CUDA 10.2) не принимает контекст CUDA в качестве аргумента; но - некоторые из них косвенно принимают идентификатор устройства. Означает ли это, что они применимы ко всем контекстам устройства?…
29 авг '20 в 22:58
1
ответ
Что cudaSetDevice() делает со стеком контекста устройства CUDA?
Предположим, у меня есть активный контекст CUDA, связанный с устройством. i, и я сейчас звоню cudaSetDevice(i). Что происходит?: Ничего? Первичный контекст заменяет верх стека? Первичный контекст помещается в стек? На самом деле это кажется непослед…
13 июл '20 в 17:07
1
ответ
получить использование памяти в контексте cuda
Есть ли способ получить использование памяти контекста cuda вместо использования cudaMemGetInfo, который сообщает только глобальную информацию об устройстве? или хотя бы способ узнать, сколько памяти занято текущим приложением?
12 ноя '19 в 10:23
1
ответ
Детализированное планирование ядра с помощью MPS
Я работаю над использованием многопроцессорной службы NVIDIA CUDA (MPS) для запуска нескольких заданий вывода TensorFlow с использованием одного и того же графического процессора. В моем случае использования, когда графический процессор используется…
21 окт '21 в 16:48
0
ответов
Семантика cuMemAdvise: разные контексты, асинхронность
Читая документацию по cuMemAdvise , я обнаружил, что задаюсь вопросом о двух моментах, один в тексте и один отсутствует в тексте: Делает cuMemAdvise()применить ко всему контексту для указанного устройства? Это не делается явным образом, и функции, з…
15 ноя '21 в 22:39
0
ответов
Что делать с CU_MEMHOSTALLOC_DEVICEMAP и CU_CTX_MAP_HOST?
Документация для cuCtxCreate() говорит, что один из требуемых флагов: CU_CTX_MAP_HOST: Проинструктируйте CUDA о поддержке сопоставленных закрепленных выделений. Этот флаг должен быть установлен, чтобы выделить закрепленную память хоста, доступную дл…
26 ноя '21 в 23:33
0
ответов
вызов времени выполнения cuda после вызова api драйвера, чрезмерные накладные расходы
Я пытался добавить вызов внешней функции cuda (с большим количеством вызовов api времени выполнения) в программу, которая включает только вызов api драйвера cuda, используя отдельную связь, описанную в , в основном компилируйте их в статическую http…
22 дек '21 в 00:49
0
ответов
Гарантируется ли, что области cuMemAlloc'ed в разном контексте не пересекаются?
Мы знаем, что механизм унифицированного виртуального адресного пространства для графических процессоров NVIDIA (Fermi и новее) позволяет нам различать адреса указателей на стороне устройства на разных устройствах; см., например: В чем разница между …
01 янв '22 в 01:41
1
ответ
API драйвера CUDA cuMemAlloc память одного контекста1 и освобождение другого контекста, почему это удается?
Я создаю 2 контекста cuda «ctx1» и «ctx2», устанавливаю текущий контекст на «ctx1», выделяю 8 байт памяти и переключаю текущий контекст на ctx2. Затем освободите выделение памяти в ctx1. Почему это возвращает CUDA_SUCCESS? И когда я уничтожу ctx1, а…
19 янв '22 в 11:08
1
ответ
Отсутствует символ: cuDevicePrimaryCtxRelease vs cuDevicePrimaryCtxRelease_v2
Я пытаюсь создать следующую программу: #include <iostream> #include <cuda.h> int main() { const char* str; auto status = cuInit(0); cuGetErrorString(status, &str); std::cout << "status = " << str << std::endl; int d…
03 фев '21 в 20:59
1
ответ
Заботится ли cuMemcpy о текущем контексте?
Предположим, у меня есть версия графического процессора и драйвера, поддерживающая унифицированную адресацию; два графических процессора, G0 и G1; буфер, выделенный в памяти устройства G1; и что текущий контекст C0 является контекстом для G0. В этих…
08 окт '22 в 12:58
0
ответов
Нужно ли сохранять параметры копирования памяти CUDA 3D?
Рассмотрим функцию CUDA API CUresult cuMemcpy3DAsync (const CUDA_MEMCPY3D* pCopy, CUstream hStream); описано здесь. ТребуетсяCUDA_MEMCPY3Dструктура по указателю ; и этот указатель относится не к какой-то сущности, созданной драйвером CUDA, а к струк…
07 фев '23 в 21:59
0
ответов
Активация, затем деактивация, а затем повторная активация основного контекста — могу ли я сохранить дескриптор?
Предположим, что для устройства без активированного основного контекста я: Звоните и узнавайте цену. ВызовcuDevicePrimaryCtxRelease(); контекст деактивируется. Позвони и получи ещеCUcontextценить. По моему (ограниченному и неподтвержденному) опыту я…
09 авг '22 в 17:52