Минимальная требуемая способность Cuda составляет 3,5
После установки TensorFlow и его зависимостей на экземпляр EC2 g2.2xlarge я попытался запустить пример MNIST со страницы начала работы:
python tensorflow/models/image/mnist/convolutional.py
Но я получаю следующее предупреждение:
I tensorflow/core/common_runtime/gpu/gpu_device.cc:611] Ignoring gpu device
(device: 0, name: GRID K520, pci bus id: 0000:00:03.0) with Cuda compute
capability 3.0. The minimum required Cuda capability is 3.5.
Это жесткое требование? Есть ли шанс, что я мог бы прокомментировать эту проверку в развилке TensorFlow? Было бы очень приятно иметь возможность тренировать модели в AWS.
3 ответа
В настоящее время официально поддерживаются только графические процессоры с возможностью вычисления>= 3.5. Тем не менее, пользователь GitHub @infojunkie предложил патч, который позволяет использовать TensorFlow с графическим процессором с вычислительной способностью 3.0.
Официальное исправление находится в разработке. Тем временем, проверьте обсуждение проблемы GitHub для добавления этой поддержки.
На официальной странице установки есть раздел, который поможет вам включить Cuda 3, но вам нужно собрать Tensorflow из исходного кода.
$ TF_UNOFFICIAL_SETTING=1 ./configure
# Same as the official settings above
WARNING: You are configuring unofficial settings in TensorFlow. Because some
external libraries are not backward compatible, these settings are largely
untested and unsupported.
Please specify a list of comma-separated Cuda compute capabilities you want to
build with. You can find the compute capability of your device at:
https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases
your build time and binary size. [Default is: "3.5,5.2"]: 3.0
Setting up Cuda include
Setting up Cuda lib64
Setting up Cuda bin
Setting up Cuda nvvm
Configuration finished
Есть простой трюк. Вам даже не нужно строить TF из источников.
В файле tensorflow\python\_pywrap_tensorflow.pyd
Есть два случая регулярного выражения 3\.5.*5\.2
, Просто замените оба 3.5
с 3.0
,
Протестировано на Windows 10, Anaconda 4.2.13, Python 3.5.2, TensorFlow 0.12, CUDA 8, NVidia GTX 660m (CUDA cap. 3.0).