Сравнивая значения потерь в журнале для вероятностного дерева суффиксов?
В PST
Пакет один может оценить качество прогнозирования отдельных последовательностей, используя log-loss
Например:
R> ex2 <- c("a-a-b", "a-b-a-a-b", "b-b-b-b-a")
R> ex2 <- seqdef(ex2)
R> predict(S1.p1, ex2, output = "logloss")
logloss
[1] 0.9183
[2] 0.7311
[3] 0.9600
Как мне сравнить эти log-loss
значения статистически? Есть ли способ показать, что 0.9183
значительно отличается от 0.9600
?