Как BPTT работает в LSTM? Как определяется усеченный временной лаг?
В LSTM, как BPTT перемещается по временному шагу? Это усеченный BPTT? Если так, как сеть знает, как определить временную задержку усечения?
В LSTM, как BPTT перемещается по временному шагу? Это усеченный BPTT? Если так, как сеть знает, как определить временную задержку усечения?