Скрытая марковская модель с новыми невидимыми наблюдениями
Я пытаюсь использовать скрытую марковскую модель, но у меня проблема в том, что мои наблюдения представляют собой триплеты непрерывных значений (температура, влажность и т. Д.). Это означает, что я не знаю точное количество моих возможных наблюдений, поскольку они не являются дискретными. Это создает проблему, из-за которой я не могу определить размер моей эмиссионной матрицы. Рассматривать дискретные значения нельзя, потому что, используя необходимый шаг для каждой переменной, я получаю несколько миллионов возможных комбинаций наблюдений. Итак, можно ли решить эту проблему с помощью HMM? По сути, может ли размер матрицы излучения меняться каждый раз, когда я получаю новое наблюдение?
1 ответ
Я думаю, вы не поняли концепцию, нет матрицы выбросов, только матрица вероятности перехода. и это постоянно. По поводу вашей проблемы с 3 неизвестными непрерывного рв. легче по сравнению с распознаванием речи, например, с 39 MFCC непрерывного рв. но в речи есть предположение, что 39 рв (твой только 3) нормально независимый, а не тождественный. Так что если вы настаиваете на НММ, то не меняйте матрицу выбросов. Вы все еще можете решить проблему.
Один из подходов состоит в том, чтобы дать новому невидимому наблюдению равную вероятность того, что оно было отправлено всеми состояниями, или присвоить им вероятность в соответствии с PDF, если вы его знаете. По крайней мере, это решит вашу ближайшую проблему. Позже, когда состояние наблюдается (я предполагаю, что вы пытаетесь предсказать состояния), вы можете переназначить реальные вероятности новому наблюдению.
Второй подход (который мне больше нравится) - это сгруппировать ваши наблюдения с использованием метода кластеризации. Таким образом, ваши наблюдения будут кластерами, а не данными в реальном времени. После сбора данных вы назначаете их соответствующему кластеру и даете HMM номер кластера в качестве наблюдения. Больше никаких "невидимых" наблюдений, о которых нужно беспокоиться.
Или вам, возможно, придется прибегнуть к непрерывной скрытой марковской модели вместо дискретной. Но у этого есть много предостережений.