Изменение в балле BLEU
У меня есть вопрос по подсчету BLUE Score для машинного перевода. Я понял, что они могут иметь разные показатели для BLEU. Я обнаружил, что код сообщает пять значений для BLEU, а именно BLEU-1, BLEU-2, BLEU-3, BLEU-4 и, наконец, BLEU, что, по-видимому, является экспоненциальным средним для предыдущих четырех BLEU. Мне все еще не ясно, в чем разница между ними. Есть ли у вас какие-либо идеи? Спасибо
Ps Сначала я подумал, что этот вопрос является скорее теоретическим содержанием, и разместил его в meta stackexange. Модератор закрыл и прокомментировал это как вопрос типа stackru. Поэтому, пожалуйста, не наказывай меня снова. знак равно
2 ответа
Источник: http://www.statmt.org/book/slides/08-evaluation.pdf
Я не слышал о BLEU-1 и BLEU-2, но я предполагаю, что это означает 1-граммовый, 2-граммовый, 3-граммовый и 4-граммовый в формуле балла BLEU, я имею в виду в формуле precision[i] = BLEU-i
в вашем вопросе:
На самом деле, BLEU-n не использует только n-граммовые оценки. Он вычисляет баллы от 1 грамма до n-грамма и дает им равный вес для вычисления итогового результата. См. Раздел "Накопительные баллы N-Gram" по этой ссылке для получения дополнительной информации.