В чем разница между жадным декодером RNN и декодером луча с k=1?

Question

В чем разница между жадным декодером RNN и декодером луча с k=1?

Учитывая вектор состояния, мы можем рекурсивно декодировать последовательность жадным образом, генерируя каждый выход последовательно, где каждое предсказание обусловлено предыдущим выходом. Недавно я прочитал статью, в которой описано использование поиска луча во время декодирования с размером луча 1 (k=1). Если мы сохраняем только лучший результат на каждом шаге, разве это не то же самое, что жадное декодирование, и не предлагает ничего из преимуществ, обычно предоставляемых поиском луча?

5

recurrent-neural-network beam-search

Источник

user2272798 14 сен '16 в 20:01

1 ответ

Решение

Другие вопросы по тегам recurrent-neural-network beam-search

user2272798 17 сен '16 в 05:58 2016-09-17 05:58 · Accepted Answer · 2016-09-17 05:58

Наконец-то нашел ответ: размер луча 1 такой же, как у жадного поиска.

Из "Обобщения абстрагируемого предложения с помощью внимательных рекуррентных нейронных сетей":

"k refers to the size of the beam for generation; k = 1 implies greedy generation."

5

Источник

user2272798 17 сен '16 в 05:58