Как включить CUDA MPS с несколькими графическими процессорами?

Я следую https://docs.nvidia.com/deploy/pdf/CUDA_Multi_Process_Service_Overview.pdf. Я пытаюсь изучить MPS.

У меня 4 графических процессора Tesla V100.

      nvidia-smi -L
GPU 0: Tesla V100-SXM2-32GB (UUID: GPU-e439908c-81a2-a394-b25f-cd421ffa07d3)
GPU 1: Tesla V100-SXM2-32GB (UUID: GPU-986144da-b09d-581c-767a-cc432f992f02)
GPU 2: Tesla V100-SXM2-32GB (UUID: GPU-6d759b1f-564f-c335-459d-b85fc4eba6d9)
GPU 3: Tesla V100-SXM2-32GB (UUID: GPU-f558ad53-2e37-30fc-1441-1668ac76a16d)

Я пытаюсь включить MPS как

      sudo CUDA_VISIBLE_DEVICES="GPU-e439908c-81a2-a394-b25f-cd421ffa07d3,GPU-986144da-b09d-581c-767a-cc432f992f02,GPU-6d759b1f-564f-c335-459d-b85fc4eba6d9,GPU-f558ad53-2e37-30fc-1441-1668ac76a16d" nvidia-cuda-mps-control -d


ps -ef | grep mps
root     27319 17555  0 09:00 pts/1    00:00:00 grep --color=auto mps
root     35425     1  0 Feb24 ?        00:00:01 nvidia-cuda-mps-control -d
1002     54742 35425  0 Feb24 ?        00:01:08 nvidia-cuda-mps-server


fuser -v /dev/nvidia*
                     USER        PID ACCESS COMMAND
/dev/nvidia0:        root       9232 F.... nvidia-device-p
                     root      33821 F.... kubelet
                     (unknown)  54742 F...m nvidia-cuda-mps
                  
/dev/nvidia1:        root       9232 F.... nvidia-device-p
                     root      33821 F.... kubelet
                     (unknown)  54742 F...m nvidia-cuda-mps
                     
/dev/nvidia2:        root       9232 F.... nvidia-device-p
                     root      33821 F.... kubelet
                     (unknown)  54742 F...m nvidia-cuda-mps
                     
/dev/nvidia3:        root       9232 F.... nvidia-device-p
                     root      33821 F.... kubelet
                     (unknown)  54742 F...m nvidia-cuda-mps
                     
/dev/nvidiactl:      root       9232 F.... nvidia-device-p
                     root      33821 F.... kubelet
                     (unknown)  54742 F...m nvidia-cuda-mps
                     
/dev/nvidia-uvm:     (unknown)  54742 F...m nvidia-cuda-mps

Когда я запускал несколько заданий TF, меня смущало, что nvidia-cuda-mps я вижу только на устройстве: только 0.

Как включить MPS для всех графических процессоров?

Спасибо

0 ответов

Другие вопросы по тегам