Описание тега gpudirect

Тег для NVIDIA GPUDirect
1 ответ

Могу ли я использовать в CUDA atomic-операции на удаленном GPU-RAM через GPUDirect 2.0 P2P?

Например, я могу использовать атомарные операции CUDA atomicAdd(ptr, val), atomicCAS(ptr, old, new),... на его глобальной памяти (GPU-RAM). С CUDA 6.5. Но могу ли я использовать эти атомарные операции для удаленной глобальной памяти через GPUDirect …
18 янв '15 в 18:47
2 ответа

Предлагает ли AMD OpenCL что-то похожее на CUDA GPUDirect?

NVIDIA предлагает GPUDirect для уменьшения накладных расходов при передаче памяти. Мне интересно, есть ли подобная концепция для AMD/ATI? В частности: 1) Избегайте ли графические процессоры AMD второй передачи памяти при взаимодействии с сетевыми ка…
15 фев '12 в 03:07
1 ответ

Всегда ли nVidia RDMA GPUDirect работает только с физическими адресами (в физическом адресном пространстве ЦП)?

Как мы знаем: http://en.wikipedia.org/wiki/IOMMU Пейджинг периферийной памяти может поддерживаться IOMMU. Периферийное устройство, использующее расширение интерфейса запросов страниц (PRI) PCIe SIG, может обнаружить и сигнализировать о необходимости…
07 ноя '13 в 16:50
1 ответ

Можно ли использовать одноранговую связь GPUDirect v2 между двумя Quadro K1100M или двумя GeForce GT 745M?

Могу ли я использовать GPUDirect v2 - одноранговую связь по одной шине PCIe?: между двумя: Мобильный nVidia Quadro K1100M между двумя: мобильная видеокарта nVidia GeForce GT 745M
19 ноя '13 в 12:58
1 ответ

Как GPUDirect обеспечивает изоляцию на общем устройстве

Я читал здесь https://developer.nvidia.com/gpudirect о GPUDirect. В этом примере есть сетевая карта, подключенная к PCIe вместе с двумя графическими процессорами и процессором. Как обеспечивается изоляция между всеми клиентами, пытающимися получить …
26 дек '13 в 10:17
1 ответ

Настройка GPUDirect для infiniband

Я пытаюсь настроить GPUDirect для использования вызовов rdma глаголов infiniband непосредственно в памяти устройства без необходимости использовать cudaMemcpy. У меня 2 машины с видеокартами nvidia k80 каждая с версией драйвера 367.27. CUDA8 установ…
11 ноя '16 в 10:56
3 ответа

CUDA: GPUDirect для GeForce GTX 690

GeForce GTX 690 (от таких производителей, как Zotac и EVGA) можно использовать для программирования CUDA, как и Tesla K10. Вопрос: GeForce GTX 690 поддерживает GPUDirect? В частности: если бы я использовал две карты GTX 690, у меня было бы 4 графиче…
01 янв '13 в 17:44
1 ответ

Nvidia GPUDirect и захват камеры на GPU

У меня есть камера USB3, и мне нужно иметь захваченные изображения для загрузки в текстуру DirectX. В настоящее время я просто делаю это в своем коде в пользовательском режиме - собираю изображения и загружаю их в графический процессор, что, конечно…
31 июл '16 в 07:28
1 ответ

Модель программирования cuda-mpi без GPUDirect

Я использую кластер GPU без поддержки GPUDirect. Из этого брифинга при передаче данных графического процессора между узлами делается следующее: GPU пишет в закрепленный sysmem1 Процессор копирует из sysmem1 в sysmem2 Копии драйверов Infiniband от sy…
20 сен '13 в 17:46
1 ответ

Как использовать GPUDirect RDMA с Infiniband

У меня есть две машины. На каждой машине есть несколько карт Тесла. На каждой машине также есть карта InfiniBand. Я хочу общаться между видеокартами на разных машинах через InfiniBand. Просто указать, чтобы указать одноадресной передачи было бы хоро…
25 июн '15 в 09:30
0 ответов

glTexSubImage2D() и glGetTextureImageEXT() используются вместо GPUDirect

Моя настройка: NVIDIA Quadro p6000 (используется для GPUDirect) Видеокарта AJA (подача SDI с камеры и вывод SDI на телевизор) Я пытаюсь выяснить, какова цель GPUDirect (в моем конкретном случае), если я могу добиться того же объема копирования и той…
18 окт '17 в 08:34
2 ответа

Передача GPUDirect RDMA с графического процессора на удаленный хост

Сценарий: У меня есть две машины, клиент и сервер, связанные с Infiniband. Серверный компьютер имеет графический процессор NVIDIA Fermi, но клиентский компьютер не имеет графический процессор. У меня есть приложение, работающее на компьютере с графи…
14 авг '12 в 10:47
0 ответов

Может ли infiniband ускорить распределенное обучение без GPUDirect?

У меня есть две машины 4x2080ti. Я хочу обучить свою распределенную модель Pytorch распределенному бэкэнду NCCL. Но обучение идет медленно, потому что эти две машины соединены сетевой картой 1000M. Поэтому я хочу использовать две карты Infiniband дл…
1 ответ

RDMA чтение и запись семантики размещения / видимости данных

Я пытаюсь получить более подробную информацию о семантике чтения и записи RDMA (особенно семантике размещения данных), и я хотел бы подтвердить свое понимание здесь экспертами. RDMA прочитал: Будут ли данные доступны / видны в локальном буфере после…
12 окт '21 в 06:25
0 ответов

Почему NVIDIA GPUDirect RDMA медленнее при отправке данных с графического процессора на сетевой адаптер, чем в обратном направлении?

У меня есть два узла с процессором AMD EPYC 7452, графическим процессором NVIDIA V100 и сетевой картой Mellanox ConnectX-6. Я реализовал простой тест RDMA, используя IB Verbs API и NVIDIA GPUDirect. Вот результат: Direction : Node 1 <- Node 2 Nod…
07 окт '21 в 12:48
0 ответов

Разница между MPI с поддержкой CUDA и GPUDirect

У меня есть вопрос о MPI и GPUDirect с поддержкой CUDA. Я пишу статью, в которой считаю, что использую GPUDirect, но рецензент заметил, что я использую только MPI с поддержкой CUDA. В используемом мной кластере установлены CUDA 8.0.61, PGI 18.1 и MV…
08 мар '21 в 21:42
1 ответ

RDMA Защита от чтения для операций с локальной памятью

У меня есть следующий сценарий: мой сервер выделяет буфер размером 1 МБ, который периодически обновляется и записывается (примерно каждые 50 мс). Клиент подключается к серверу через Infiniband и периодически считывает этот буфер через RDMA Read (воз…
26 апр '22 в 15:18
0 ответов

Взаимодействие GPUDirect Storage с процессором

Я пытаюсь понять, как работает GPUDirect Storage. Функции, которые выполняют большую часть тяжелой работы, — это cuFileWrite и cuFileRead. Это как функции API cuda. Они вызываются с хоста. Однако я думал, что весь смысл GPUDirect Storage заключается…
03 окт '22 в 17:14
0 ответов

GPUDirect RDMA вне диапазона контактного адреса Quadro p620

Я хочу реализовать FPGA-GPU RDMA на nvidia quadro p620. Кроме того, я использовал общие ресурсы PCIe BAR (BAR0 - BAR1 - BAR2) для обработки регистров FPGA и других контроллеров фрагментов, которые не зависят от RDMA в моем пользовательском драйвере.…
18 дек '22 в 09:19
0 ответов

RDMA поддерживает функцию GPUDirect.

Графические процессоры NVIDIA хотят использовать функцию GPUDirect RDMA. Должен ли он использовать аппаратный сетевой адаптер RDMA от Mellanox, такой как сетевой адаптер ConnectX-5, или я могу использовать другой сетевой адаптер RDMA от других компа…
06 мар '23 в 08:45