CNTK в Azure Data Science VM

У меня есть виртуальная машина Azure серии N (виртуальная машина с данными) с графическим процессором Tesla K80. Согласно сканеру NVIDIA, мой драйвер GPU обновлен. Когда я запускаю свой CNTK Brainscript, он говорит "GPU не найдены" и работает в режиме CPU. Что я могу сделать, чтобы устранить неполадки?

requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques
ted); we (0) are in (participating)
-------------------------------------------------------------------
Build info:

            Built time: Dec 22 2016 01:43:24
            Last modified date: Thu Dec 22 01:35:04 2016
            Build type: Release
            Build target: GPU
            With 1bit-SGD: yes
            With ASGD: yes
            Math lib: mkl
            CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8
.0
            CUB_PATH: c:\src\cub-1.4.1
            CUDNN_PATH: C:\local\cudnn-8.0-windows10-x64-v5.1
            Build Branch: HEAD
            Build SHA1: 8e8b5ff92eff4647be5d41a5a515956907567126
            Built by svcphil on DPHAIM-24
            Build Path: C:\jenkins\workspace\CNTK-Build-Windows\Source\CNTK\

-------------------------------------------------------------------
No GPUs found

Изменить: вот выход из NVidia_smi.exe:

C:\Program Files\NVIDIA Corporation\NVSMI>.\nvidia-smi.exe
Fri Jan 13 19:00:43 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 369.30                 Driver Version: 369.30                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla K80           TCC  | 0BD1:00:00.0     Off |                  Off |
| N/A   43C    P8    27W / 149W |      0MiB / 12189MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  Tesla K80           TCC  | 5871:00:00.0     Off |                  Off |
| N/A   35C    P8    34W / 149W |      0MiB / 12189MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

3 ответа

Решение

По умолчанию виртуальная машина Windows Data Science не поставляется с драйверами графического процессора, CUDA и т. Д. У нас есть расширение под названием "Инструментарий глубокого обучения для DSVM", которое добавляет драйверы, CUDA и выпуск графических процессоров для графических процессоров, таких как CNTK, Tensorflow, MxNet.

Дополнительная информация: http://aka.ms/dsvm/deeplearning

Мы также недавно выпустили версию DSVM для Ubuntu со встроенным CUDA, драйверами графического процессора и несколькими более глубокими инструментами обучения, и ее можно развернуть на виртуальной машине с графическим процессором или только на процессоре в Azure.

Можно ли было запустить ноутбуки python и посмотреть, сможете ли вы запустить их с устройством, на котором установлено gpu(id)? или из активированной среды Python CNTK вы можете попробовать настроить какое-либо устройство.

import cntk as C
from cntk.device import set_default_device, gpu
C.device.set_default_device(C.device.gpu(0))

Это может дать вам некоторые подсказки, является ли это специфической проблемой Brainscript.

Итак, скрипт Python и Brainscript теперь работают после установки CUDA (я установил его для запуска NVIDIA_SMI). Я не должен был предполагать, что в образе Azure Data Science (который работает только с виртуальной машиной N Series) предварительно установлены необходимые библиотеки NVIDIA.:-)

Другие вопросы по тегам