Вероятности смешивания MclustDA и оценка параметров

Я использую пакет R mclust для выполнения классификации дискриминационных функций на основе модели. Я немного озадачен тем, как интерпретировать выходные данные вероятности микширования, и хотел бы получить четкое объяснение.

Насколько я понимаю, кластеризация набора данных с использованием Mclust() Функция позволяет получить вектор вероятностей смешения, которые в сумме составляют 1, что соответствует пропорциям данных, назначенных этим кластерам. Количество кластеров контролируется G команда. Чтобы получить представление об изменении этих оценок, вы можете запустить загрузчик с помощью MclustBootstrap, чтобы получить доверительные интервалы вокруг этих оценок пропорций.

Но при использовании MclustDA() Функция каждого класса - это не просто кластер, каждый класс может представлять собой собственную смесь гауссиан, максимальное число которых контролируется G команда. Таким образом, он будет соответствовать каждому классу с несколькими распределениями Гаусса и, таким образом, множественными вероятностями смешивания, которые составляют 1 в пределах класса. На самом деле не существует вывода общих вероятностей смешивания между классами, как я ожидал.

cvMclustDA() Команда дает общую частоту ошибок перекрестной проверки, но меня интересует, могу ли я лучше понять разницу в пропорциях, назначенных каждому классу, или ошибку назначения внутри классов, а не только в целом.

Есть ли способ добраться до этого? Может ли это быть достигнуто при использовании z матрица после запуска predict() позвонить по исходным данным? Или путем начальной загрузки прогнозов исходных данных?

0 ответов

Другие вопросы по тегам