Google Colab: Nvidia-Smi и Libtorch больше не совместимы
Проблема новая и никогда раньше не возникала, поэтому могло быть обновление драйвера nvidia или libtorch. Проблема: я использую Google Colab в качестве дополнительного графического процессора и хочу установить программу, для которой требуется libtorch. Итак, последние пару недель установка работала нормально, однако, начиная с сегодняшнего дня, программа не может быть установлена. Я уже пытался перезагрузить несколько раз, перезагрузить и т. Д., Но ничего не работает. Я также загрузил новую версию libtorch для cuda 11.3 и обновил cuda, чтобы среда выполнения работала на cuda 11.3. Когда я звоню
он выдает информацию как обычно. Тем не менее, после добавления libtorch в качестве переменной среды по мере необходимости для использования libtorch с помощью
os.environ['LIBTORCH'] = "/content/libtorch"
а также
os.environ['LD_LIBRARY_PATH'] = "/content/libtorch/lib"
!nvidia-smi
внезапно отображается сообщение «Не удалось инициализировать NVML: несовпадение версии драйвера / библиотеки». И поскольку это происходит, я больше не могу установить программу.
Итак, я устанавливаю rustc (поскольку программа требует rustup) и добавляю его в путь с помощью
os.environ['PATH] += os.pathsep + "path/to/.cargo/bin"
Я добавляю Libtorch как переменную окружения. Пытаюсь загрузить программу. Обычно он работал нормально, теперь он не работает, выдает сообщение об ошибке:
error: linking with `cc` failed: exit status: 1
= note: "cc" "-m64" "-Wl,--eh-frame-hdr" "-Wl,-znoexecstack" "-Wl,--as-needed" "-L" "/usr/lib/rustlib/x86_64-unknown-linux-gnu/lib"
.........................................
= note: /usr/bin/ld: cannot find -ltorch_cuda
/usr/bin/ld: cannot find -ltorch_cuda_cu
/usr/bin/ld: cannot find -ltorch_cuda_cpp
/usr/bin/ld: cannot find -ltorch_cpu
/usr/bin/ld: cannot find -ltorch
/usr/bin/ld: cannot find -lc10
collect2: error: ld returned 1 exit status