Взвешенный кросс-энтропийный тензор потока
Я не смог найти встроенный тензор потока, который позволял бы передавать метки, которые не суммируются с 1, поэтому попытался написать свою собственную: (входные данные [batch_size, метки])
tf.reduce_mean(tf.reduce_sum(y_true,axis=1) * tf.reduce_logsumexp(y_pred_logits,axis=1)
- tf.reduce_sum(y_true * y_pred_logits,axis=1))
Однако, похоже, что это не работает (потери расходятся). Я сделал что-то неправильно?
1 ответ
Я думаю, что это было правильно, но я установил слишком низкий "эпсилон" оптимизатора Адама.