Обучение последовательности для моделей последовательности
Мне интересно, когда мы тренируем последовательность к модели последовательности, следует ли нам кормить основную правду? Я имею в виду для прогнозирования на временном шаге (t+1), должны ли мы подавать в декодер прогнозирование временного шага (t) или основную истинность временного шага (t)?
Заранее спасибо за помощь!