Добавить образец информации в набор данных в PCA (R)

Я биолог, а не программист, поэтому будьте осторожны.

Итак, у меня есть набор данных, который выглядит как

      Genes  Patient1   Patient2   Patient3
A          324      433         343
B          431       342        124
Z          232       234        267

то у меня есть образец листа, где он содержит образец информации, например:

      Patient1 - Healthy
Patient2 - Disease
Patient3 - Healthy

Я использую:

      library(ggfortify)
df <- dataset
pca_res <- prcomp(df, scale. = TRUE)

autoplot(pca_res)

Тогда я хочу сделать

      autoplot(pca_res, data = ?, colour = '?')

Я хочу использовать информацию из таблицы образцов, чтобы раскрасить свой PCA в зависимости от состояния (здоровый / болезнь) с помощью функции автоплота. Есть ли способ сделать это?

1 ответ

Сначала я бы создал полный data.frame со всей доступной информацией.

Например, вам нужно будет создать такой data.frame:

      df=structure(list(A = c(324, 433, 343), B = c(431, 342, 124), Z = c(232, 
234, 267), Status = c("Healthy", "Disease", "Healthy")), row.names = c("Patient1", 
"Patient2", "Patient3"), class = "data.frame")

После вы можете использовать factoextra пакет, который очень удобен для построения PCA:

      pca_res <- prcomp(df, scale. = TRUE)
library(factoextra)
fviz_pca_ind(pca_res, habillage=df$Status)

Вы можете проверить fviz_pca_ind документация по изменению цвета после этого

Другие вопросы по тегам