WebUI для распределенного тензорного потока?

Ранее я использовал Spark и был очень хорошо знаком с Spark WebUI (localhost:8080). Я смог проверить, подключен ли работник к мастеру, сколько рабочих подключено? Количество оперативной памяти, используемой в каждом работнике и так далее.

Tensorflow использует gRPC для распределенных вычислений. RAM и GPU Memory жизненно важны для распределенных вычислений. Существует ли какая-либо утилита, которая работает как Spark WebUI для распределенного Tensorflow, предполагая, что первый параметр сервер / идентификатор задачи в качестве главного и рабочие в качестве подчиненного?

Примечание. Использование средства записи резюме с помощью одного работника и загрузка журналов в тензорную доску отличается от того, чего я хочу достичь.

0 ответов

Другие вопросы по тегам