Описание тега pca
Анализ главных компонентов (PCA) - это статистический метод уменьшения размерности, часто используемый при кластеризации или факторном анализе. Учитывая любое количество объясняющих или причинных переменных, PCA ранжирует переменные по их способности объяснять наибольшие вариации в данных. Именно это свойство позволяет использовать PCA для уменьшения размерности, т. Е. Для определения наиболее важных переменных из большого набора возможных влияний.
3
ответа
Пропустить NA и вменение данных перед выполнением анализа PCA с использованием R
Я пытаюсь сделать анализ PCA, используя princomp функция в R. Ниже приведен пример кода: mydf <- data.frame ( A = c("NA", rnorm(10, 4, 5)), B = c("NA", rnorm(9, 4, 5), "NA"), C = c("NA", "NA", rnorm(8, 4, 5), "NA") ) out <- princomp(mydf, cor …
30 апр '12 в 15:41
0
ответов
Ожидаемый результат анализа основных компонентов Spark (PCA)
Я работаю над проектом, в котором мне нужно выполнить кластеризацию K-средних с MLlib от Spark. Проблема в том, что мои данные имеют 744 особенности. Я провел небольшое исследование и обнаружил, что мне нужен PCA. Самое приятное, что Spark PCA реали…
29 май '17 в 22:12
1
ответ
Как я могу нарисовать их на графиках одного и того же цвета и разных цветов?
Мне просто нужно поставить эти графики на один и тот же, и точки первого должны быть другого цвета, чем второй. Я думаю, что это что-то очень легко, но я не могу найти это, пожалуйста, помогите. Спасибо library(ggfortify) myPCA <- prcomp(iris[-5]…
23 апр '16 в 10:21
2
ответа
Scikit-Learn PCA
Я использую входные данные отсюда (см. Раздел 3.1). Я пытаюсь воспроизвести их ковариационную матрицу, собственные значения и собственные векторы, используя scikit-learn. Однако я не могу воспроизвести результаты, представленные в источнике данных. …
30 дек '14 в 04:21
1
ответ
Собственный вектор и собственное значение матрицы 8 X 8
У меня есть матрица чисел с плавающей запятой 8 x 8, и мне нужно вычислить собственный вектор и собственное значение. Это для сокращения возможностей с использованием PCA (анализ основных компонентов) и является чертовски трудоемкой работой, если вы…
12 июл '12 в 06:09
1
ответ
Как использовать матричный результат PCA для обучения модели?
Здравствуйте, я хотел бы уменьшить размер моей матрицы поезда, чтобы затем использовать вспомогательную векторную машину, мой код выглядит следующим образом: from sklearn.decomposition import PCA Сначала я попробовал выполнить PCA: pca = PCA(n_compo…
10 фев '17 в 04:46
1
ответ
Как использовать функцию dmvnorm и mapply вместе
set.seed(1) ### i would like to do this dmvnorm(c(.5,.5), mean= c(2,15), matrix(c(3, 0, 0, 9), 2)) dmvnorm(c(.6,.6), mean= c(5,18), matrix(c(6, 0, 0, 15), 2)) ##### BUT using mapply instead... how can that be done? u1 = c(2,15) sigma1 = matrix(c(3, …
03 ноя '16 в 20:49
1
ответ
Почему ядро перезагружается, когда я пробую sklearn PCA?
Я использую Ipython Notebook и при вводе кода: import numpy as np from sklearn.decomposition import PCA pca = PCA(n_components=2) pca.fit(data) Я получаю уведомление о том, что ядро умерло и перезапустилось. Что здесь происходит? Также мои данные …
12 июн '14 в 20:13
0
ответов
PCA и T2 Хотеллинга в Python
Я пытаюсь построить T2 Хотеллинга в Python, и я хотел бы построить, как показано ниже в R. PCA и T^2 Хотеллинга для доверительного интервала в R И я увидел комментарий (ссылка ниже), помогающий с этим, в Python. Но было бы полезно более подробное пр…
20 ноя '18 в 13:52
1
ответ
Как сравнить прогнозирующую способность PCA и NMF
Я хотел бы сравнить выходные данные алгоритма с различными предварительно обработанными данными: NMF и PCA. Чтобы получить какой-то сопоставимый результат, вместо того, чтобы выбирать одинаковое количество компонентов для каждого PCA и NMF, я хотел …
08 янв '18 в 10:46
0
ответов
Распознавание лиц с использованием PCA на Matlab
Я пытаюсь классифицировать набор изображений с использованием PCA на Matlab. Учебный набор содержит ~1800 изображений 380 человек, каждое изображение с уникальной этикеткой (ID) человека. Тестовый набор содержит ~750 изображений тех же 380 человек (…
01 ноя '15 в 14:51
1
ответ
Выберите K в PCA python skitlearn
Я пытаюсь использовать пакет skitlearn для PCA . На веб-сайте документации, приведенном здесь http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html Говорят, что если n_components == 'mle', то mle используется для определени…
24 мар '16 в 15:31
2
ответа
Как правильно использовать PCA с последующей логистической регрессией?
В программе я сканирую несколько образцов мозга, взятых во временном ряду изображений 40 x 64 x 64 каждые 2,5 секунды. Таким образом, число "вокселей" (3D-пикселей) в каждом изображении составляет ~ 168 000 иш (40 * 64 * 64), каждый из которых являе…
26 сен '16 в 17:55
1
ответ
Я получаю неожиданное значение NaN при попытке pd.concat. Как с этим бороться? PCA против T-SNE
Я пытаюсь уменьшить размерность данных с помощью PCA, однако, когда я использую concat, он автоматически генерирует значение NaN. Также возраст клиента стал плавать, пока он был int. Может кто-нибудь сказать, пожалуйста, как я могу решить эту пробле…
21 июн '18 в 13:36
1
ответ
Как добавить цвета и легенду к ordiellipse в базовом пакете в R?
У меня есть датафрейм (сайт по видам матрицы), который выглядит так: SP1 SP2 SP3 SP4 US 5 6 2 5 US 5 6 2 5 UK 5 6 2 5 AUS 5 6 2 5 Я пытаюсь создать график PCoA (анализ основных координат) с полигонами / эллипсами с вероятностью 95%. Мне нужно однозн…
09 мар '17 в 19:37
1
ответ
Как я могу узнать, какие размеры являются основным компонентом?
Я использую функцию princomp в Matlab для PCA. Насколько я понимаю, я мог проверить латентность, чтобы решить, сколько измерений мне нужно. [coeff, score, latent, t2] = princomp(fdata); cumsum(latent)./sum(latent); И с помощью trainMatrix = coeff(:,…
24 апр '13 в 22:00
1
ответ
Самозагрузка собственных значений для нелинейного PCA в r
Я запускаю нелинейный PCA в r, используя пакет homals. Вот фрагмент кода, который я использую в качестве примера: res1 <- homals(data = mydata, rank = 1, ndim = 9, level = "nominal") res1 <- rescale(res1) Я хочу сгенерировать 1000 загрузочных …
12 апр '18 в 11:29
3
ответа
Визуальное сравнение регрессии и PCA
Я пытаюсь усовершенствовать метод сравнения регрессии и PCA, вдохновленный блогом Cerebral Mastication, который также обсуждался с другой точки зрения на SO. Прежде чем я забуду, большое спасибо JD Long и Josh Ulrich за большую часть этого. Я собира…
10 дек '11 в 14:46
1
ответ
Рассчитайте многомерное расстояние от центра галактического пространства
У меня есть матрица данных под названием mydf который содержит 10 основных компонентов (10 измерений) в галактическом пространстве с 5 образцами. Я хочу найти центроид (гравитационный центр) образцов, используя все ПК, и расстояние для каждого образ…
15 апр '16 в 09:42
0
ответов
Разреженный анализ главных компонентов с использованием sklearn
Я пытаюсь воспроизвести приложение из этой статьи, где авторы загружают данные 20 групп новостей и используют SPCA для извлечения основных компонентов, которые в некотором смысле лучше всего описывают текстовый корпус [см. Раздел 4.1]. Это для проек…
20 дек '17 в 12:46