Какова конечная цель методов RobustPCA?
У меня есть постоянное исследование, посвященное кластеризации, и для назначения каждой точки данных определенному кластеру я использую критерий Махаланобиса, который серьезно основан на ковариационной матрице кластера. Как всем известно, если мощность кластера меньше или равна его размерности, то ковариационная матрица будет единственной и, следовательно, расстояние Махаланобиса больше не будет надежным!
Но дело в том, что я слышал, что можно было бы победить такие проблемы, используя методы RobustPCA. Как уже упоминалось в этом методе ROBPCA, в третьем абзаце раздела "Введение":
Цель надежных методов PCA состоит в том, чтобы получить основные компоненты, которые не сильно подвержены влиянию выбросов
Я думаю, что он пытается сказать, что методы RobustPCA полезны только тогда, когда мы хотим извлечь простые принципиальные компоненты, которые получены через реальные точки данных, но не grossly corrupted observations
, Поэтому говорить о том, что мы можем использовать его для преодоления проблемы критерия Махаланобиса, вызванной singularity problem of the covariance matrix of the cluster
!
Тем не менее, это правильно?!
С уважением...