Описание тега nvlink

NVLink - это мощный инструмент, обеспечивающий автоматическое создание вершинных шейдеров.
2 ответа

NvLink или PCIe, как указать межсоединение?

Мой кластер оснащен как Nvlink, так и PCIe. Все графические процессоры (V100) могут связываться напрямую через PCIe или NvLink. Насколько мне известно, и коммутатор PCIe, и Nvlink могут поддерживать прямую связь через CUDA. Теперь я хочу сравнить пр…
06 ноя '18 в 14:45
1 ответ

Странное поведение cudaMemcpyAsync: 1. cudaMemcpyKind не имеет значения. 2. Копировать не удается, но молча

Я знакомлюсь с новым кластером, оснащенным графическими процессорами Pascal P100 +Nvlink. Я написал программу для пинг-понга для проверки пропускной способности gpu<->gpu и gpu<->cpu и однорангового доступа. (Я знаю, что примеры cuda содержат такую …
15 июн '17 в 18:40
1 ответ

Предупреждение CUDA nvlink: SM Arch ('sm_35') не найден

Вчера установил cuda-6.5 на мою убунуту 14.04. Я следовал инструкциям, изложенным в руководстве по началу работы cuda. Проверено на Системные требования и мое было в порядке. Делал предустановки, удалил ранее установленную cuda и установил менеджер …
15 мар '15 в 13:21
3 ответа

Невозможно расшифровать ошибку nvlink

Я пытаюсь построить проект с nvcc, Я получаю самое неприятное nvlink error: сообщения, которые я когда-либо видел. Вот ссылка на заявление: nvcc -rdc=true -arch=sm_21 -O3 -Xcompiler -fPIC -I"/usr/local/ACE_wrappers" -I"/usr/local/ACE_wrappers/TAO" -…
16 янв '14 в 21:26
1 ответ

Как создать сеанс Tensorflow с графическим процессором nvlink

Я пытаюсь сделать вывод с Tensorflow. У меня есть 2 Quadro GV100, подключенных через nvlink и другой графический процессор для отображения на моем рабочем столе. Когда я создаю объект SessionOptions, мне нужно вызвать следующее, чтобы установить, ка…
04 янв '19 в 00:03
2 ответа

Почему nvlink предупреждает меня об отсутствии объектного кода sm_20 (вычислительная возможность 2.0)?

Я работаю с CUDA 6.5 на машине с картой GTX Titan (вычислительная способность 3.5). Я строю свой код только с -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 - и когда я связываю свой бинарный файл, nvlink говорит: nvlink war…
12 фев '16 в 13:00
1 ответ

Колебания пропускной способности в соединении Nvlink (p2pBandwidthLatencyTest)

Топология моего кластера показана на первом рисунке: Тем не менее, работает p2pBandwidthLatencyTestЯ получил непредсказуемый результат. Пропускная способность между 2 а также 3 очевидно ниже чем 0 а также 1, Есть ли кто-нибудь, кто знает возможную п…
29 окт '18 в 09:33
0 ответов

Ошибка nvlink при связывании кода CUDA со статической библиотекой CUDA - CMake

Я создаю статическую библиотеку, которая содержит некоторый код CUDA и обычный код C++. CMakeLists.txt для этой статической библиотеки выглядит следующим образом: SET(TARGET_H some_header.h) SET(CUDA_SRC cudaclass1.cu cudaclass2.cu) SET(TARGET_SRC c…
20 мар '14 в 17:30
1 ответ

Может ли встроенное устройство nvlink функционировать из отдельных модулей компиляции?

Если отдельные единицы компиляции, которые подают в качестве входных данных для nvlink содержит ядра cuda и функции устройства, которые вызывают функции устройства, помеченные как __forceinline__Будут ли эти функции встроены? Предположим, что они бу…
25 июл '18 в 04:39
1 ответ

Ошибка nvlink: неопределенная ссылка на * в 'Debug/*.cu.obj' (Отдельная компиляция CUDA, Visual Studio 2013)

У меня есть очень простой строковый класс, объявленный и определенный в StringT.cu и StringT.cpp соответственно. StringT.cu #ifndef STRING_T_CU #define STRING_T_CU #include "cuda_runtime.h" class StringT { public: static const int MAX_LEN = 15; __ho…
26 янв '19 в 01:01
0 ответов

Не вижу никаких переводов на NVLINK с тестом NCCL all_sum

С помощью следующего кода (использует tensorflow.contrib.nccl.all_sum), Я ожидал увидеть передачу байтов через NVLINK. На самом деле, нет. from tensorflow.contrib.nccl import all_sum with tf.device('/gpu:0'): a = tf.get_variable( "a", initializer=tf…
28 ноя '18 в 20:02
0 ответов

Можно ли временно отключить соединение nvlink и использовать только PCI?

Я хочу проверить влияние соединения nvlink, когда выполняются вычисления на многих графических процессорах. У меня есть 4 Tesla V100, подключенных по nvlink, и мой вопрос: Можно ли временно отключить это соединение, чтобы использовать только слот PC…
12 сен '18 в 10:01
1 ответ

Tensorflow, Horovod и NVLINK NotFoundError

Я пытаюсь запустить нейросеть тензорного потока, которая работает на графических процессорах, используя библиотеку уберов Horovod. В то же время я пытаюсь запустить скрипт измерения, который измеряет nvlinks между несколькими графическими процессора…
09 мар '19 в 20:39
0 ответов

Почему мои графические процессоры Tesla V100 подключены через PCI, а не через NVLink на GCP?

Я приобрел экземпляр на GCP с 2 Tesla V100, но они подключены через PCIe, а не NVLink. Как я могу убедиться, что они подключены через NVLink?
08 авг '19 в 15:46
0 ответов

Как эффективно выполнять двухточечное копирование памяти для графических процессоров без прямого доступа к NVLINK?

Я пытаюсь установить связь точка-точка на рабочей станции DGX с 8 графическими процессорами. Я могу добиться хорошей производительности, используя cudaMemcpyPeer между графическими процессорами с прямым доступом к NVLINK. Но у некоторых графических …
28 июл '20 в 22:20
0 ответов

какой cross_device_ops нам нужно выбрать для tf.distribute.MirroredStrategy?

Я пытаюсь обучить модель с помощью tf.distribute.MirroredStrategy с двумя картами RTX 3090 без nvlink. В этом случае, какой cross_device_ops будет лучшим выбором для tf.distribute.MirroredStrategy?
08 окт '20 в 11:48
0 ответов

Передача Cuda p2p с использованием nvlink без активации SLI

Я хотел бы знать, можно ли сделать P2P-копию между двумя графическими процессорами с помощью nvlink, но без включения функции Slip в панели управления nvidia. Я спрашиваю, потому что у меня есть 2 процесса ProcessA (внутреннее программное обеспечени…
23 апр '21 в 01:34
1 ответ

OpenACC nvlink undefined ссылка на класс

Я новичок в OpenACC и пишу новую программу с нуля (у меня есть довольно хорошее представление о том, какие циклы потребуют больших вычислительных затрат, если раньше работать с аналогичной проблемой). Я получаю "неопределенную ссылку" от nvlink. Из …
09 май '21 в 17:19
1 ответ

Код OpenCL N-body с двумя машинами GPU NVIDIA A6000 (с подключением NVLink между собой)

Я бы хотел запустить старое N-тело, использующее OpenCL. У меня 2 карты NVIDIA A6000 с NVLink, компонент, который связывает с аппаратной (и, возможно, программной?) точки зрения эти 2 карты GPU. Но при исполнении получаю следующий результат: ядро от…
27 июл '21 в 18:55
1 ответ

Как указать тип Nvlink при использовании NCCL

В системе DGX-1 (8xV100) есть два типа NVlinks: NVlink-V1 и NVlink-V2, есть ли способ явно указать, какие типы NVlink мы используем для p2p и коллективного общения?
30 сен '21 в 08:22