Определите оставшуюся дисперсию в каждом компоненте в неотрицательной матричной факторизации (NMF)
Мне было интересно, возможно ли определить дисперсию, сохраняющуюся в каждом компоненте NMF.
Например, используя PCA, это можно определить следующим образом: 'retainedVariance(i) = собственное значение (i) / сумма (собственное значение)'
где собственное значение (i) обозначает i-е собственное значение ковариационной матрицы.
Чтобы установить это в контексте: грубо говоря, я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA.
Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел бы выбрать количество, которое объясняет, например, 95% оставшейся дисперсии.
Я думаю, что это может дать более сопоставимый результат.
Спасибо, что нашли время:)