Расчет растерянности с обученными н-граммами
У меня есть несколько натренированных n(2, 3, 4, 5)-грамм, например:
Frequency trigrams
43 the more abstract
34 the more accessible
74 the more accurate
56 the more active
131 the more advanced
25 the more adventurous
Как рассчитать недоумение нового следующего с этими данными n-грамм? Я знаю формулу вычисления недоумения, но я не могу понять, как соединить эти вещи в коде. Помощь на любом языке программирования будет оценена. Заранее спасибо!