Есть ли какой-то способ сохранить лучшую модель только с tenorsflow.estimator.train_and_evaluate()?
Я пытаюсь переобучить модель API обнаружения объектов TF из контрольной точки с помощью уже файла.config для обучающего конвейера с помощью метода tf.estimator.train_and_evaluate (), как в models / research / object_detection / model_main.py. И это сохраняет контрольные точки каждые N шагов или каждые N секунд.
Но я хочу сохранить только одну лучшую модель, как в Керасе. Есть ли какой-нибудь способ сделать это с моделью API TF Object Detection? Может быть, некоторые опции / обратные вызовы для tf.Estimator.train или какой-то способ использования API обнаружения с Keras?
2 ответа
Вы можете попробовать использовать BestExporter
, Насколько я знаю, это единственный вариант того, что вы пытаетесь сделать.
exporter = tf.estimator.BestExporter(
compare_fn=_loss_smaller,
exports_to_keep=5)
eval_spec = tf.estimator.EvalSpec(
input_fn,
steps,
exporters)
https://www.tensorflow.org/api_docs/python/tf/estimator/BestExporter
Я использовал https://github.com/bluecamel/best_checkpoint_copier который хорошо работает для меня.
Пример:
best_copier = BestCheckpointCopier(
name='best', # directory within model directory to copy checkpoints to
checkpoints_to_keep=10, # number of checkpoints to keep
score_metric='metrics/total_loss', # metric to use to determine "best"
compare_fn=lambda x,y: x.score < y.score, # comparison function used to determine "best" checkpoint (x is the current checkpoint; y is the previously copied checkpoint with the highest/worst score)
sort_key_fn=lambda x: x.score,
sort_reverse=False) # sort order when discarding excess checkpoints
передать его в свой eval_spec:
eval_spec = tf.estimator.EvalSpec(
...
exporters=best_copier,
...)
Если вы тренируетесь с использованием репозитория моделей tensorflow/models.models/research/object_detection/model_lib.py
файл create_train_and_eval_specs
функцию можно изменить, чтобы включить в нее лучшего экспортера:
final_exporter = tf.estimator.FinalExporter(
name=final_exporter_name, serving_input_receiver_fn=predict_input_fn)
best_exporter = tf.estimator.BestExporter(
name="best_exporter",
serving_input_receiver_fn=predict_input_fn,
event_file_pattern='eval_eval/*.tfevents.*',
exports_to_keep=5)
exporters = [final_exporter, best_exporter]
train_spec = tf.estimator.TrainSpec(
input_fn=train_input_fn, max_steps=train_steps)
eval_specs = [
tf.estimator.EvalSpec(
name=eval_spec_name,
input_fn=eval_input_fn,
steps=eval_steps,
exporters=exporters)
]