Добавить образец информации в набор данных в PCA (R)
Я биолог, а не программист, поэтому будьте осторожны.
Итак, у меня есть набор данных, который выглядит как
Genes Patient1 Patient2 Patient3
A 324 433 343
B 431 342 124
Z 232 234 267
то у меня есть образец листа, где он содержит образец информации, например:
Patient1 - Healthy
Patient2 - Disease
Patient3 - Healthy
Я использую:
library(ggfortify)
df <- dataset
pca_res <- prcomp(df, scale. = TRUE)
autoplot(pca_res)
Тогда я хочу сделать
autoplot(pca_res, data = ?, colour = '?')
Я хочу использовать информацию из таблицы образцов, чтобы раскрасить свой PCA в зависимости от состояния (здоровый / болезнь) с помощью функции автоплота. Есть ли способ сделать это?
1 ответ
Сначала я бы создал полный data.frame со всей доступной информацией.
Например, вам нужно будет создать такой data.frame:
df=structure(list(A = c(324, 433, 343), B = c(431, 342, 124), Z = c(232,
234, 267), Status = c("Healthy", "Disease", "Healthy")), row.names = c("Patient1",
"Patient2", "Patient3"), class = "data.frame")
После вы можете использовать
factoextra
пакет, который очень удобен для построения PCA:
pca_res <- prcomp(df, scale. = TRUE)
library(factoextra)
fviz_pca_ind(pca_res, habillage=df$Status)
Вы можете проверить
fviz_pca_ind
документация по изменению цвета после этого