Поиск Витерби - гипотетические вероятности
Я создаю скрытую марковскую модель, чтобы определить, говорит ли кто-то "да" или "нет". Я разработал скрытую марковскую модель и наткнулся на учебник на этой странице:
http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html
И в этом уроке говорится:
На этом рисунке прослеживаются пути поиска "да" и "нет" через гипотетическую матрицу вероятностей. Несмотря на то, что оценка "нет" очень низкая, все же возможно найти наиболее вероятный путь для этого слова, если бы "да" не было в нашем словаре. Поиск Витерби можно понять, прочитав следующий алгоритм псевдокода (с записью, заимствованной из статьи Рабинера, "Учебник по скрытым марковским моделям и выбранные приложения в распознавании речи"):
Я прочитал обе газеты, и я все еще смущен тем, что они говорят:
through a hypothetical matrix of probabilities
Мои вопросы: откуда берется эта Матрица вероятностей? Например, я сделал следующее:
- Читать в аудио файле
- Раздели аудио сигналы, которые не требуют рассмотрения
- Разделите сигналы, которые требуют рассмотрения, на блоки
Это означает, что у меня остались блоки с фонемами. Я вычислил нулевые пересечения данных и, таким образом, привел меня к моей точке:
Для "Нет" данные из этого очень низкие,
Для "Да" данные из этого очень высоки.
Таким образом, в приведенном выше примере это говорит:
Even though the score for "no" is very low,
Так мог ли я просто передать результаты пересечения нуля как мои вероятности? Я в замешательстве и надеюсь, что кто-нибудь может мне помочь с этим.
1 ответ
В философском смысле эта матрица вероятностей исходит от природы. Более серьезно, эта матрица представляет идею матрицы перехода, которая может быть рассчитана Баумом Уэлчем на выборочных данных, если не "знать" истинное распределение природы (никто не знает). Вот почему они говорят, что это гипотетически.
Что касается вашего второго вопроса, вам нужно получить матрицу переходов (вероятности), применив Baum Welch к вашим выборкам пересечения нуля (я не уверен, что такое выборки пересечения нуля, обычно mfcc используется для такого рода вещей),
Дайте мне знать, если требуются дополнительные разъяснения или я что-то неправильно понимаю.