Вероятности смешивания MclustDA и оценка параметров
Я использую пакет R mclust для выполнения классификации дискриминационных функций на основе модели. Я немного озадачен тем, как интерпретировать выходные данные вероятности микширования, и хотел бы получить четкое объяснение.
Насколько я понимаю, кластеризация набора данных с использованием Mclust()
Функция позволяет получить вектор вероятностей смешения, которые в сумме составляют 1, что соответствует пропорциям данных, назначенных этим кластерам. Количество кластеров контролируется G
команда. Чтобы получить представление об изменении этих оценок, вы можете запустить загрузчик с помощью MclustBootstrap, чтобы получить доверительные интервалы вокруг этих оценок пропорций.
Но при использовании MclustDA()
Функция каждого класса - это не просто кластер, каждый класс может представлять собой собственную смесь гауссиан, максимальное число которых контролируется G
команда. Таким образом, он будет соответствовать каждому классу с несколькими распределениями Гаусса и, таким образом, множественными вероятностями смешивания, которые составляют 1 в пределах класса. На самом деле не существует вывода общих вероятностей смешивания между классами, как я ожидал.
cvMclustDA()
Команда дает общую частоту ошибок перекрестной проверки, но меня интересует, могу ли я лучше понять разницу в пропорциях, назначенных каждому классу, или ошибку назначения внутри классов, а не только в целом.
Есть ли способ добраться до этого? Может ли это быть достигнуто при использовании z
матрица после запуска predict()
позвонить по исходным данным? Или путем начальной загрузки прогнозов исходных данных?