Взвешивание компонентов GMM
Как определить вес каждого компонента GMM
Относительно модели гауссовой смеси (GMM) для классификации и кластеризации.вес для каждого гауссова компонента произвольно устанавливается как среднее от общего числа компонентов.
Это ведется в соответствии со здравым смыслом в большинстве учебников, статей и практических целей.
- Есть ли теоретическая работа по этому вопросу?
- Или это действительно тривиальная проблема?
Любые подсказки приветствуются
1 ответ
Одна разумная вещь, которую нужно сделать, это установить вес смеси в соответствии с предыдущими вероятностями, но в большинстве случаев я видел, что вес смеси является скрытой переменной и оценивается с помощью EM.
Вы можете выполнить кластеризацию по k-среднему значению с k, равным количеству нужных вам смесей, и пропорционально инициализировать веса. Это еще один способ сделать это, и это имеет некоторый смысл.
Если вы знаете членство в смеси для некоторых из ваших тренировочных данных, вы можете использовать это и оценить предыдущую вероятность и использовать ее для инициализации веса ваших смесей, но я никогда не видел подобного случая.
С другой стороны, нет принципиального метода для определения количества смесей, и я думаю, что научное сообщество убеждено, что его нет.