Как проверить устройство любой переменной тензорного потока? Требуется проверить во время распределенного обучения

В настройке распределенного тензорного потока я не использую метод tf.train.replica_device_setter(..), а пытаюсь напрямую запустить его с помощью tf.device("/job:%s/task:%d" % (FLAGS.job_name, FLAGS.task_index)) вместо.

При этом не главный работник не может извлекать переменные. Он зависает при запуске мастер-сессии, поэтому мне нужно проверить, почему это происходит. Кто-нибудь знает об этой проблеме? Пожалуйста помоги.

0 ответов

Другие вопросы по тегам