Оценка Bleu в метрике оценки модели

Во многих реализациях seq2seq я видел, что они используют метрику точности при компиляции модели и оценку Bleu только в прогнозах.

Почему они не используют Bleu для обучения, чтобы быть более эффективными? если я правильно понял!

1 ответ

Решение

Двуязычная оценка Оценка дублера предназначалась для замены людей, поэтому слово "дублер" входит в его название.

Теперь, когда вы тренируете свои данные, у вас уже есть целевое значение, и вы можете напрямую сравнить с ним сгенерированный вывод, но когда вы прогнозируете набор данных, у вас нет способа измерить, соответствует ли предложение, в которое вы перевели, правильный. Вот почему вы используете Bleu, потому что ни один человек не может проверять после каждого машинного перевода правильность того, что вы предсказали, или нет, а Bleu обеспечивает проверку работоспособности.

PS Заместитель означает, что кто-то учится у наставника, чтобы заменить его в случае необходимости, Bleu "учится" у людей, а затем может оценить перевод.

Для получения дополнительной информации ознакомьтесь с https://www.youtube.com/watch?v=9ZvTxChwg9A&list=PL1w8k37X_6L_s4ncq-swTBvKDWnRSrinI&index=28

Если есть вопросы, прокомментируйте ниже.

Другие вопросы по тегам