Что означает функция объединенного признака в структурном прогнозировании?
При описании алгоритма structured perceptron
(используется в structured SVM
также), используемое правило вывода:
y_hat = argmax_y (w * fee(x,y) )
В чем смысл этой совместной функции fee(x,y)
? Иногда это выражается как: fee(x,y) = 0.5*y*x
- Зачем?