R: Цветовые точки в PCA на основе групп при использовании автоплота

Я создал график PCA, где я строю график числа клеток на основе их экспрессии различных генов. На этом графике я хочу раскрасить некоторые точки отдельным цветом. Я пытался добиться этого, создавая "группы", где я сортирую клетки на основе их экспрессии или отсутствия экспрессии "gene1".

Вот как выглядит мой фрейм данных (gene1, gene2 и cell_1, cell_2 и т. Д. - это имена столбцов и строк):

          gene1      gene2      gene3      gene4      gene5
cell_1   0.0000   0.279204  25.995400  46.171700  94.234100
cell_2   0.0000  23.456000  77.339800 194.241000 301.234000
cell_3   2.0000  13.100000  45.309200   0.776565   0.000000
cell_4   0.0000  10.500000 107.508000   3.032500   0.000000
cell_5   3.0000   0.000000   0.266139   0.762981 123.371000

Вот код, который я использую, чтобы попытаться достичь этого:

library(ggplot2)
library(ggfortify)

# Group cells based on expression of a certain gene (to use for color labels in the next step)
groups <- factor(ifelse(df$gene1 > 0, "Positive", "Others"))

#Calculate PCs and plot PCA
autoplot(prcomp(log(df[]+1)), colour="Positive")

Когда я запускаю этот код, я получаю следующую ошибку:

Error in grDevices::col2rgb(colour, TRUE) : invalid color name 'Positive'

1 ответ

Решение

Как насчет этого?

df$groups <- factor(ifelse(df$gene1 > 0, "Positive", "Others"))

head(df)
      gene1     gene2    gene3     gene4      gene5   groups
1 0.5638534  8.968558 94.40170  62.93106 290.442698 Positive
2 0.0000000 15.248374 45.87507 204.21703 291.501669   Others
3 1.9059518 19.488162 75.89302  97.69643 177.833347 Positive
4 1.9449987  6.358773 54.97159  41.54307 164.835188 Positive
5 0.0000000 16.568077 31.62370  23.72278  31.774541   Others
6 1.7199368  3.788276 80.51450 102.82221   6.259461 Positive

autoplot(prcomp(log(df[1:5]+1)), data=df, colour='groups')

введите описание изображения здесь

Другие вопросы по тегам