Использование TPU на Cloud ML Engine
Я пытаюсь использовать TPU на Cloud ML Engine, но не знаю, как мне предоставить tpu
аргумент, который TPUClusterResolver
надеется.
Это среда, которую я использую:
--python-version 3.5 \
--runtime-version 1.12 \
--region us-central1 \
--scale-tier BASIC_TPU
Работа падает с:
ValueError: Please provide a TPU Name to connect to.
Как отдельная проблема - двигатель ML, кажется, добавляет --master grpc://10.129.152.2:8470
сам по себе на мою работу, которая также терпит крах работы. В качестве обходного пути я просто добавил неиспользуемый главный флаг в свой код.
1 ответ
Решение
Это была известная проблема для времени выполнения 1.11 и 1.12, и она была исправлена. Теперь сервис не будет добавляться --master
к вашему обучающему приложению. Вы должны продолжать использовать TpuClusterResolver
,