Взвешивание компонентов GMM

Как определить вес каждого компонента GMM

Относительно модели гауссовой смеси (GMM) для классификации и кластеризации.вес для каждого гауссова компонента произвольно устанавливается как среднее от общего числа компонентов.

Это ведется в соответствии со здравым смыслом в большинстве учебников, статей и практических целей.

  1. Есть ли теоретическая работа по этому вопросу?
  2. Или это действительно тривиальная проблема?

Любые подсказки приветствуются

1 ответ

Одна разумная вещь, которую нужно сделать, это установить вес смеси в соответствии с предыдущими вероятностями, но в большинстве случаев я видел, что вес смеси является скрытой переменной и оценивается с помощью EM.

Вы можете выполнить кластеризацию по k-среднему значению с k, равным количеству нужных вам смесей, и пропорционально инициализировать веса. Это еще один способ сделать это, и это имеет некоторый смысл.

Если вы знаете членство в смеси для некоторых из ваших тренировочных данных, вы можете использовать это и оценить предыдущую вероятность и использовать ее для инициализации веса ваших смесей, но я никогда не видел подобного случая.

С другой стороны, нет принципиального метода для определения количества смесей, и я думаю, что научное сообщество убеждено, что его нет.

Другие вопросы по тегам