Как проверить устройство любой переменной тензорного потока? Требуется проверить во время распределенного обучения
В настройке распределенного тензорного потока я не использую метод tf.train.replica_device_setter(..), а пытаюсь напрямую запустить его с помощью tf.device("/job:%s/task:%d" % (FLAGS.job_name, FLAGS.task_index)) вместо.
При этом не главный работник не может извлекать переменные. Он зависает при запуске мастер-сессии, поэтому мне нужно проверить, почему это происходит. Кто-нибудь знает об этой проблеме? Пожалуйста помоги.