Получение stylegan для запуска на экземпляре gcp с v100
Я пытался заставить stylegan работать на gcp для подключения к v100. Я был в состоянии сделать обучение для 1d, используя эту настройку экземпляра
export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"
# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
--zone=$ZONE \
--image-family=$IMAGE_FAMILY \
--image-project=deeplearning-platform-release \
--maintenance-policy=TERMINATE \
--accelerator="type=nvidia-tesla-v100,count=1" \
--machine-type=$INSTANCE_TYPE \
--boot-disk-size=200GB \
--metadata="install-nvidia-driver=True"
для большого набора данных я запускаю тот же код для другого набора данных, и он, похоже, не использует v100. Я должен был запустить! Pip установить tennsflow-gpu оба раза
когда я пытаюсь код с
export IMAGE_FAMILY="tf-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west1-a" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"
# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
--zone=$ZONE \
--image-family=$IMAGE_FAMILY \
--image-project=deeplearning-platform-release \
--maintenance-policy=TERMINATE \
--accelerator="type=nvidia-tesla-v100,count=1" \
--machine-type=$INSTANCE_TYPE \
--boot-disk-size=200GB \
--metadata="install-nvidia-driver=True"
Я получаю ошибки при запуске файла data_tool.py для создания записей и по какой-то причине не могу запустить python3 в лабораторной среде jupyter.
Также весь код работает на google colab, что заставляет задуматься, какой тип экземпляра есть у colab, и могу ли я просто найти скрипт для установки того же экземпляра с v100?
0 ответов
Ваша первая команда:
export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"
# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
--zone=$ZONE \
--image-family=$IMAGE_FAMILY \
--image-project=deeplearning-platform-release \
--maintenance-policy=TERMINATE \
--accelerator="type=nvidia-tesla-v100,count=1" \
--machine-type=$INSTANCE_TYPE \
--boot-disk-size=200GB \
--metadata="install-nvidia-driver=True"
использует семейство изображений pytorch-latest-gpu
этот образ НЕ имеет предварительно установленного TensorFlow и не должен использоваться с задачами TensorFlow.
что касается второй команды, она использует tf-latest-gpu
семья, которая является правильной. Могу я попросить предоставить нам более подробную информацию:
- какой код вы пытаетесь запустить?
- вы можете скопировать сюда ошибку?
- если он работает на Colab, может быть, у вас есть ссылка на общедоступный блокнот Colab?
Кстати, Colab использует 1 графический процессор K80.