Получение stylegan для запуска на экземпляре gcp с v100

Я пытался заставить stylegan работать на gcp для подключения к v100. Я был в состоянии сделать обучение для 1d, используя эту настройку экземпляра

 export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

для большого набора данных я запускаю тот же код для другого набора данных, и он, похоже, не использует v100. Я должен был запустить! Pip установить tennsflow-gpu оба раза

когда я пытаюсь код с

export IMAGE_FAMILY="tf-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west1-a" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

Я получаю ошибки при запуске файла data_tool.py для создания записей и по какой-то причине не могу запустить python3 в лабораторной среде jupyter.

Также весь код работает на google colab, что заставляет задуматься, какой тип экземпляра есть у colab, и могу ли я просто найти скрипт для установки того же экземпляра с v100?

0 ответов

Ваша первая команда:

export IMAGE_FAMILY="pytorch-latest-gpu" # or "pytorch-latest-cpu" for non-GPU instances
export ZONE="us-west2-b" # budget: "us-west1-b"
export INSTANCE_NAME="my-fastai-instance"
export INSTANCE_TYPE="n1-highmem-8" # budget: "n1-highmem-4"

# budget: 'type=nvidia-tesla-k80,count=1'
gcloud compute instances create $INSTANCE_NAME \
        --zone=$ZONE \
        --image-family=$IMAGE_FAMILY \
        --image-project=deeplearning-platform-release \
        --maintenance-policy=TERMINATE \
        --accelerator="type=nvidia-tesla-v100,count=1" \
        --machine-type=$INSTANCE_TYPE \
        --boot-disk-size=200GB \
        --metadata="install-nvidia-driver=True"

использует семейство изображений pytorch-latest-gpu этот образ НЕ имеет предварительно установленного TensorFlow и не должен использоваться с задачами TensorFlow.

что касается второй команды, она использует tf-latest-gpuсемья, которая является правильной. Могу я попросить предоставить нам более подробную информацию:

  • какой код вы пытаетесь запустить?
  • вы можете скопировать сюда ошибку?
  • если он работает на Colab, может быть, у вас есть ссылка на общедоступный блокнот Colab?

Кстати, Colab использует 1 графический процессор K80.

Другие вопросы по тегам