Как интерпретировать вывод модели Maxent (для маркировки POS)
Я новичок в НЛП и читал о максимальной энтропии (MaxEnt) подход для маркировки POS. Теперь мои вопросы:
- метод максимальной энтропии создает "модель", основанную на обучающих данных (уже помеченное текстовое тело)... поэтому эта модель является распределением вероятности, которое гарантирует все характеристики, а также максимизирует значение энтропии?
- как выглядит эта "функция распределения модели / вероятности"? у нас есть пример или место, где мы можем увидеть, что находится внутри этой модели? это похоже на стол? коллекция вероятностей и особенностей?
- как используется эта "модель"? Есть ли место, где мы можем увидеть простой пример... например, если предложение "Я в замешательстве", то модель каким-то образом проверяется / ищется и помечает все 3 вышеупомянутых слова? Что, если новое предложение, которое не следует ни за какой существующей функцией, будет передано в модель?
Извините за наивные вопросы... трудно под всем этим, думаю, я еще не в зоне.
Спасибо!