Анализ главных компонентов (PCA) - это статистический метод уменьшения размерности, часто используемый при кластеризации или факторном анализе. Учитывая любое количество объясняющих или причинных переменных, PCA ранжирует переменные по их способности объяснять наибольшие вариации в данных. Именно это свойство позволяет использовать PCA для уменьшения размерности, т. Е. Для определения наиболее важных переменных из большого набора возможных влияний.
3 ответа

Пропустить NA и вменение данных перед выполнением анализа PCA с использованием R

Я пытаюсь сделать анализ PCA, используя princomp функция в R. Ниже приведен пример кода: mydf <- data.frame ( A = c("NA", rnorm(10, 4, 5)), B = c("NA", rnorm(9, 4, 5), "NA"), C = c("NA", "NA", rnorm(8, 4, 5), "NA") ) out <- princomp(mydf, cor …
30 апр '12 в 15:41
0 ответов

Ожидаемый результат анализа основных компонентов Spark (PCA)

Я работаю над проектом, в котором мне нужно выполнить кластеризацию K-средних с MLlib от Spark. Проблема в том, что мои данные имеют 744 особенности. Я провел небольшое исследование и обнаружил, что мне нужен PCA. Самое приятное, что Spark PCA реали…
29 май '17 в 22:12
1 ответ

Как я могу нарисовать их на графиках одного и того же цвета и разных цветов?

Мне просто нужно поставить эти графики на один и тот же, и точки первого должны быть другого цвета, чем второй. Я думаю, что это что-то очень легко, но я не могу найти это, пожалуйста, помогите. Спасибо library(ggfortify) myPCA <- prcomp(iris[-5]…
23 апр '16 в 10:21
2 ответа

Scikit-Learn PCA

Я использую входные данные отсюда (см. Раздел 3.1). Я пытаюсь воспроизвести их ковариационную матрицу, собственные значения и собственные векторы, используя scikit-learn. Однако я не могу воспроизвести результаты, представленные в источнике данных. …
30 дек '14 в 04:21
1 ответ

Собственный вектор и собственное значение матрицы 8 X 8

У меня есть матрица чисел с плавающей запятой 8 x 8, и мне нужно вычислить собственный вектор и собственное значение. Это для сокращения возможностей с использованием PCA (анализ основных компонентов) и является чертовски трудоемкой работой, если вы…
12 июл '12 в 06:09
1 ответ

Как использовать матричный результат PCA для обучения модели?

Здравствуйте, я хотел бы уменьшить размер моей матрицы поезда, чтобы затем использовать вспомогательную векторную машину, мой код выглядит следующим образом: from sklearn.decomposition import PCA Сначала я попробовал выполнить PCA: pca = PCA(n_compo…
10 фев '17 в 04:46
1 ответ

Как использовать функцию dmvnorm и mapply вместе

set.seed(1) ### i would like to do this dmvnorm(c(.5,.5), mean= c(2,15), matrix(c(3, 0, 0, 9), 2)) dmvnorm(c(.6,.6), mean= c(5,18), matrix(c(6, 0, 0, 15), 2)) ##### BUT using mapply instead... how can that be done? u1 = c(2,15) sigma1 = matrix(c(3, …
1 ответ

Почему ядро ​​перезагружается, когда я пробую sklearn PCA?

Я использую Ipython Notebook и при вводе кода: import numpy as np from sklearn.decomposition import PCA pca = PCA(n_components=2) pca.fit(data) Я получаю уведомление о том, что ядро ​​умерло и перезапустилось. Что здесь происходит? Также мои данные …
12 июн '14 в 20:13
0 ответов

PCA и T2 Хотеллинга в Python

Я пытаюсь построить T2 Хотеллинга в Python, и я хотел бы построить, как показано ниже в R. PCA и T^2 Хотеллинга для доверительного интервала в R И я увидел комментарий (ссылка ниже), помогающий с этим, в Python. Но было бы полезно более подробное пр…
20 ноя '18 в 13:52
1 ответ

Как сравнить прогнозирующую способность PCA и NMF

Я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA. Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел …
0 ответов

Распознавание лиц с использованием PCA на Matlab

Я пытаюсь классифицировать набор изображений с использованием PCA на Matlab. Учебный набор содержит ~1800 изображений 380 человек, каждое изображение с уникальной этикеткой (ID) человека. Тестовый набор содержит ~750 изображений тех же 380 человек (…
01 ноя '15 в 14:51
1 ответ

Выберите K в PCA python skitlearn

Я пытаюсь использовать пакет skitlearn для PCA . На веб-сайте документации, приведенном здесь http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html Говорят, что если n_components == 'mle', то mle используется для определени…
24 мар '16 в 15:31
2 ответа

Как правильно использовать PCA с последующей логистической регрессией?

В программе я сканирую несколько образцов мозга, взятых во временном ряду изображений 40 x 64 x 64 каждые 2,5 секунды. Таким образом, число "вокселей" (3D-пикселей) в каждом изображении составляет ~ 168 000 иш (40 * 64 * 64), каждый из которых являе…
26 сен '16 в 17:55
1 ответ

Я получаю неожиданное значение NaN при попытке pd.concat. Как с этим бороться? PCA против T-SNE

Я пытаюсь уменьшить размерность данных с помощью PCA, однако, когда я использую concat, он автоматически генерирует значение NaN. Также возраст клиента стал плавать, пока он был int. Может кто-нибудь сказать, пожалуйста, как я могу решить эту пробле…
1 ответ

Как добавить цвета и легенду к ordiellipse в базовом пакете в R?

У меня есть датафрейм (сайт по видам матрицы), который выглядит так: SP1 SP2 SP3 SP4 US 5 6 2 5 US 5 6 2 5 UK 5 6 2 5 AUS 5 6 2 5 Я пытаюсь создать график PCoA (анализ основных координат) с полигонами / эллипсами с вероятностью 95%. Мне нужно однозн…
09 мар '17 в 19:37
1 ответ

Как я могу узнать, какие размеры являются основным компонентом?

Я использую функцию princomp в Matlab для PCA. Насколько я понимаю, я мог проверить латентность, чтобы решить, сколько измерений мне нужно. [coeff, score, latent, t2] = princomp(fdata); cumsum(latent)./sum(latent); И с помощью trainMatrix = coeff(:,…
1 ответ

Самозагрузка собственных значений для нелинейного PCA в r

Я запускаю нелинейный PCA в r, используя пакет homals. Вот фрагмент кода, который я использую в качестве примера: res1 <- homals(data = mydata, rank = 1, ndim = 9, level = "nominal") res1 <- rescale(res1) Я хочу сгенерировать 1000 загрузочных …
12 апр '18 в 11:29
3 ответа

Визуальное сравнение регрессии и PCA

Я пытаюсь усовершенствовать метод сравнения регрессии и PCA, вдохновленный блогом Cerebral Mastication, который также обсуждался с другой точки зрения на SO. Прежде чем я забуду, большое спасибо JD Long и Josh Ulrich за большую часть этого. Я собира…
10 дек '11 в 14:46
1 ответ

Рассчитайте многомерное расстояние от центра галактического пространства

У меня есть матрица данных под названием mydf который содержит 10 основных компонентов (10 измерений) в галактическом пространстве с 5 образцами. Я хочу найти центроид (гравитационный центр) образцов, используя все ПК, и расстояние для каждого образ…
15 апр '16 в 09:42
0 ответов

Разреженный анализ главных компонентов с использованием sklearn

Я пытаюсь воспроизвести приложение из этой статьи, где авторы загружают данные 20 групп новостей и используют SPCA для извлечения основных компонентов, которые в некотором смысле лучше всего описывают текстовый корпус [см. Раздел 4.1]. Это для проек…
20 дек '17 в 12:46