Tensorflow - контрольные точки не сохраняются в Sagemaker Notebook Instance

Я запускаю скрипт Python с Tensorflow в экземпляре блокнота Amazon Sagemaker. У меня нет проблем с записью в хранилище в ноутбуке, но по какой-то причине у меня не получается сохранить контрольные точки модели Tensorflow. Этот код работал до того, как был перенесен в Sagemaker.

Ниже приведена уменьшенная версия моего кода:

bucket = 'sagemaker-complaints-data'    
prefix = 'DeepTestV2' # place to upload training files within the bucket
timestamp = str(int(time()))
out_dir = os.path.abspath(os.path.join(bucket, prefix, "runs", timestamp))
checkpoint_dir = os.path.abspath(os.path.join(out_dir, "checkpoints"))
checkpoint_prefix = os.path.join(checkpoint_dir, "model")
path = saver.save(sess, checkpoint_prefix, global_step=current_step)
print("Saved model checkpoint to {}\n".format(path))

Не выдается никаких ошибок, и оператор print выводит правильный путь. Я исследовал, есть ли какие-либо известные проблемы с использованием контрольных точек в Sagemaker, но буквально не встретил постов, описывающих это.

1 ответ

Решение

Я выяснил, где это - по какой-то причине "контрольные точки" кажутся зарезервированным словом - изменение слова на "чеки" позволило мне написать папку. Надеюсь, это поможет кому-то!

Другие вопросы по тегам