Использование TPU на Cloud ML Engine

Я пытаюсь использовать TPU на Cloud ML Engine, но не знаю, как мне предоставить tpu аргумент, который TPUClusterResolver надеется.

Это среда, которую я использую:

--python-version 3.5 \
--runtime-version 1.12 \
--region us-central1 \
--scale-tier BASIC_TPU

Работа падает с:

ValueError: Please provide a TPU Name to connect to.

Как отдельная проблема - двигатель ML, кажется, добавляет --master grpc://10.129.152.2:8470 сам по себе на мою работу, которая также терпит крах работы. В качестве обходного пути я просто добавил неиспользуемый главный флаг в свой код.

1 ответ

Решение

Это была известная проблема для времени выполнения 1.11 и 1.12, и она была исправлена. Теперь сервис не будет добавляться --master к вашему обучающему приложению. Вы должны продолжать использовать TpuClusterResolver,

Другие вопросы по тегам