Работа по обучению платформы AI завершена с ненулевым статусом 1. Причина завершения: ошибка
Мое задание на обучение Tensorflow завершается с ненулевым статусом 1 и не выдает никаких полезных сообщений об ошибках. Трассировка выглядит так, как будто она скрыта [...], и предоставленная ссылка аналогична. Вот что выводят журналы:
Я проверил учетную запись службы, которая выполняет роль агента службы Cloud ML и имеет разрешения для logging.logEntries.create. В описании агента службы Cloud ML также говорится:
Агент службы Cloud ML может выступать в качестве средства записи журнала, администратора облачного хранилища, средства чтения реестра артефактов, средства записи BigQuery и создателя токена доступа к учетной записи службы.
Итак, я предполагаю, что у него есть разрешения на запись журналов в регистратор... Мой вопрос в том, как мне решить, почему моя работа не работает с этим?
1 ответ
Возможно, у вашего обучающего экземпляра виртуальной машины недостаточно прав для записи журналов. Получите имя учетной записи службы виртуальной машины, перейдите к ролям IAM и назначьте
Log writer
роль в учетной записи службы.