Есть ли какой-то способ сохранить лучшую модель только с tenorsflow.estimator.train_and_evaluate()?

Я пытаюсь переобучить модель API обнаружения объектов TF из контрольной точки с помощью уже файла.config для обучающего конвейера с помощью метода tf.estimator.train_and_evaluate (), как в models / research / object_detection / model_main.py. И это сохраняет контрольные точки каждые N шагов или каждые N секунд.

Но я хочу сохранить только одну лучшую модель, как в Керасе. Есть ли какой-нибудь способ сделать это с моделью API TF Object Detection? Может быть, некоторые опции / обратные вызовы для tf.Estimator.train или какой-то способ использования API обнаружения с Keras?

2 ответа

Решение

Вы можете попробовать использовать BestExporter, Насколько я знаю, это единственный вариант того, что вы пытаетесь сделать.

exporter = tf.estimator.BestExporter(
      compare_fn=_loss_smaller,
      exports_to_keep=5)

eval_spec = tf.estimator.EvalSpec(
    input_fn,
    steps,
    exporters)

https://www.tensorflow.org/api_docs/python/tf/estimator/BestExporter

Я использовал https://github.com/bluecamel/best_checkpoint_copier который хорошо работает для меня.

Пример:

best_copier = BestCheckpointCopier(
   name='best', # directory within model directory to copy checkpoints to
   checkpoints_to_keep=10, # number of checkpoints to keep
   score_metric='metrics/total_loss', # metric to use to determine "best"
   compare_fn=lambda x,y: x.score < y.score, # comparison function used to determine "best" checkpoint (x is the current checkpoint; y is the previously copied checkpoint with the highest/worst score)
   sort_key_fn=lambda x: x.score,
   sort_reverse=False) # sort order when discarding excess checkpoints

передать его в свой eval_spec:

eval_spec = tf.estimator.EvalSpec(
   ...
   exporters=best_copier,
   ...)

Если вы тренируетесь с использованием репозитория моделей tensorflow/models.models/research/object_detection/model_lib.py файл create_train_and_eval_specs функцию можно изменить, чтобы включить в нее лучшего экспортера:

final_exporter = tf.estimator.FinalExporter(
    name=final_exporter_name, serving_input_receiver_fn=predict_input_fn)

best_exporter = tf.estimator.BestExporter(
    name="best_exporter",
    serving_input_receiver_fn=predict_input_fn,
    event_file_pattern='eval_eval/*.tfevents.*',
    exports_to_keep=5)
exporters = [final_exporter, best_exporter]

train_spec = tf.estimator.TrainSpec(
    input_fn=train_input_fn, max_steps=train_steps)

eval_specs = [
    tf.estimator.EvalSpec(
        name=eval_spec_name,
        input_fn=eval_input_fn,
        steps=eval_steps,
        exporters=exporters)
]
Другие вопросы по тегам