Описание тега nvlink
NVLink - это мощный инструмент, обеспечивающий автоматическое создание вершинных шейдеров.
2
ответа
NvLink или PCIe, как указать межсоединение?
Мой кластер оснащен как Nvlink, так и PCIe. Все графические процессоры (V100) могут связываться напрямую через PCIe или NvLink. Насколько мне известно, и коммутатор PCIe, и Nvlink могут поддерживать прямую связь через CUDA. Теперь я хочу сравнить пр…
06 ноя '18 в 14:45
1
ответ
Странное поведение cudaMemcpyAsync: 1. cudaMemcpyKind не имеет значения. 2. Копировать не удается, но молча
Я знакомлюсь с новым кластером, оснащенным графическими процессорами Pascal P100 +Nvlink. Я написал программу для пинг-понга для проверки пропускной способности gpu<->gpu и gpu<->cpu и однорангового доступа. (Я знаю, что примеры cuda содержат такую …
15 июн '17 в 18:40
1
ответ
Предупреждение CUDA nvlink: SM Arch ('sm_35') не найден
Вчера установил cuda-6.5 на мою убунуту 14.04. Я следовал инструкциям, изложенным в руководстве по началу работы cuda. Проверено на Системные требования и мое было в порядке. Делал предустановки, удалил ранее установленную cuda и установил менеджер …
15 мар '15 в 13:21
3
ответа
Невозможно расшифровать ошибку nvlink
Я пытаюсь построить проект с nvcc, Я получаю самое неприятное nvlink error: сообщения, которые я когда-либо видел. Вот ссылка на заявление: nvcc -rdc=true -arch=sm_21 -O3 -Xcompiler -fPIC -I"/usr/local/ACE_wrappers" -I"/usr/local/ACE_wrappers/TAO" -…
16 янв '14 в 21:26
1
ответ
Как создать сеанс Tensorflow с графическим процессором nvlink
Я пытаюсь сделать вывод с Tensorflow. У меня есть 2 Quadro GV100, подключенных через nvlink и другой графический процессор для отображения на моем рабочем столе. Когда я создаю объект SessionOptions, мне нужно вызвать следующее, чтобы установить, ка…
04 янв '19 в 00:03
2
ответа
Почему nvlink предупреждает меня об отсутствии объектного кода sm_20 (вычислительная возможность 2.0)?
Я работаю с CUDA 6.5 на машине с картой GTX Titan (вычислительная способность 3.5). Я строю свой код только с -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 - и когда я связываю свой бинарный файл, nvlink говорит: nvlink war…
12 фев '16 в 13:00
1
ответ
Колебания пропускной способности в соединении Nvlink (p2pBandwidthLatencyTest)
Топология моего кластера показана на первом рисунке: Тем не менее, работает p2pBandwidthLatencyTestЯ получил непредсказуемый результат. Пропускная способность между 2 а также 3 очевидно ниже чем 0 а также 1, Есть ли кто-нибудь, кто знает возможную п…
29 окт '18 в 09:33
0
ответов
Ошибка nvlink при связывании кода CUDA со статической библиотекой CUDA - CMake
Я создаю статическую библиотеку, которая содержит некоторый код CUDA и обычный код C++. CMakeLists.txt для этой статической библиотеки выглядит следующим образом: SET(TARGET_H some_header.h) SET(CUDA_SRC cudaclass1.cu cudaclass2.cu) SET(TARGET_SRC c…
20 мар '14 в 17:30
1
ответ
Может ли встроенное устройство nvlink функционировать из отдельных модулей компиляции?
Если отдельные единицы компиляции, которые подают в качестве входных данных для nvlink содержит ядра cuda и функции устройства, которые вызывают функции устройства, помеченные как __forceinline__Будут ли эти функции встроены? Предположим, что они бу…
25 июл '18 в 04:39
1
ответ
Ошибка nvlink: неопределенная ссылка на * в 'Debug/*.cu.obj' (Отдельная компиляция CUDA, Visual Studio 2013)
У меня есть очень простой строковый класс, объявленный и определенный в StringT.cu и StringT.cpp соответственно. StringT.cu #ifndef STRING_T_CU #define STRING_T_CU #include "cuda_runtime.h" class StringT { public: static const int MAX_LEN = 15; __ho…
26 янв '19 в 01:01
0
ответов
Не вижу никаких переводов на NVLINK с тестом NCCL all_sum
С помощью следующего кода (использует tensorflow.contrib.nccl.all_sum), Я ожидал увидеть передачу байтов через NVLINK. На самом деле, нет. from tensorflow.contrib.nccl import all_sum with tf.device('/gpu:0'): a = tf.get_variable( "a", initializer=tf…
28 ноя '18 в 20:02
0
ответов
Можно ли временно отключить соединение nvlink и использовать только PCI?
Я хочу проверить влияние соединения nvlink, когда выполняются вычисления на многих графических процессорах. У меня есть 4 Tesla V100, подключенных по nvlink, и мой вопрос: Можно ли временно отключить это соединение, чтобы использовать только слот PC…
12 сен '18 в 10:01
1
ответ
Tensorflow, Horovod и NVLINK NotFoundError
Я пытаюсь запустить нейросеть тензорного потока, которая работает на графических процессорах, используя библиотеку уберов Horovod. В то же время я пытаюсь запустить скрипт измерения, который измеряет nvlinks между несколькими графическими процессора…
09 мар '19 в 20:39
0
ответов
Почему мои графические процессоры Tesla V100 подключены через PCI, а не через NVLink на GCP?
Я приобрел экземпляр на GCP с 2 Tesla V100, но они подключены через PCIe, а не NVLink. Как я могу убедиться, что они подключены через NVLink?
08 авг '19 в 15:46
0
ответов
Как эффективно выполнять двухточечное копирование памяти для графических процессоров без прямого доступа к NVLINK?
Я пытаюсь установить связь точка-точка на рабочей станции DGX с 8 графическими процессорами. Я могу добиться хорошей производительности, используя cudaMemcpyPeer между графическими процессорами с прямым доступом к NVLINK. Но у некоторых графических …
28 июл '20 в 22:20
0
ответов
какой cross_device_ops нам нужно выбрать для tf.distribute.MirroredStrategy?
Я пытаюсь обучить модель с помощью tf.distribute.MirroredStrategy с двумя картами RTX 3090 без nvlink. В этом случае, какой cross_device_ops будет лучшим выбором для tf.distribute.MirroredStrategy?
08 окт '20 в 11:48
0
ответов
Передача Cuda p2p с использованием nvlink без активации SLI
Я хотел бы знать, можно ли сделать P2P-копию между двумя графическими процессорами с помощью nvlink, но без включения функции Slip в панели управления nvidia. Я спрашиваю, потому что у меня есть 2 процесса ProcessA (внутреннее программное обеспечени…
23 апр '21 в 01:34
1
ответ
OpenACC nvlink undefined ссылка на класс
Я новичок в OpenACC и пишу новую программу с нуля (у меня есть довольно хорошее представление о том, какие циклы потребуют больших вычислительных затрат, если раньше работать с аналогичной проблемой). Я получаю "неопределенную ссылку" от nvlink. Из …
09 май '21 в 17:19
1
ответ
Код OpenCL N-body с двумя машинами GPU NVIDIA A6000 (с подключением NVLink между собой)
Я бы хотел запустить старое N-тело, использующее OpenCL. У меня 2 карты NVIDIA A6000 с NVLink, компонент, который связывает с аппаратной (и, возможно, программной?) точки зрения эти 2 карты GPU. Но при исполнении получаю следующий результат: ядро от…
27 июл '21 в 18:55
1
ответ
Как указать тип Nvlink при использовании NCCL
В системе DGX-1 (8xV100) есть два типа NVlinks: NVlink-V1 и NVlink-V2, есть ли способ явно указать, какие типы NVlink мы используем для p2p и коллективного общения?
30 сен '21 в 08:22