Расчет растерянности с обученными н-граммами

У меня есть несколько натренированных n(2, 3, 4, 5)-грамм, например:

Frequency   trigrams
43          the     more    abstract
34          the     more    accessible
74          the     more    accurate
56          the     more    active
131         the     more    advanced
25          the     more    adventurous

Как рассчитать недоумение нового следующего с этими данными n-грамм? Я знаю формулу вычисления недоумения, но я не могу понять, как соединить эти вещи в коде. Помощь на любом языке программирования будет оценена. Заранее спасибо!

0 ответов

Другие вопросы по тегам