С накоплением диаграммы, окраска отдельных клеток

Я пытаюсь создать диаграмму с накоплением, но с отдельными ячейками, окрашенными на основе отдельного значения. Это пример набора данных, который я использую:

count sample label
50      A    DD
20      A    BB
20      A    CC
10      A    AA
20      B    JJ
20      B    LL
10      B    BB
15      B    CC
30      B    AA
5       B    HH

Я использую следующий код для создания графика и раскраски ячеек, которые я хочу раскрасить, но он окрашивает неправильные ячейки. Я не уверен, почему, хотя:

Library(lattice)
data$rank <- rank(data$count)
colVec <- rep("white", nrow(data))
colVec[data$label == "AA"] <- "red"
barchart(count ~ sample, groups = as.factor(rank), stack = TRUE, data = data, 
    as.table = TRUE, col = colVec, ylab = "Counts")

В этом примере я хочу, чтобы верхняя полоса в образце B и последняя полоса в образце A были окрашены в красный цвет (ячейки с меткой AA), но в итоге мы получили 5 совершенно разных ячеек.

Реальный набор данных, с которым я собираюсь использовать этот код, содержит тысячи примеров записей, поэтому я не могу использовать ручной подход.

2 ответа

Часть groups определяет, как составные части столбчатой ​​диаграммы названы и отсортированы. Поэтому вам нужно создать новый вектор группировки, который имеет уникальные имена для каждого блока и сортируется в нужном вам порядке. Тогда вы можете просто установить цветовой вектор соответствующим образом.

data$label2 <- paste(data$label, data$sample)
data$label2 <- reorder(data$label2, data$rank)
colVec = rep("white", length(levels(data$label2)))
colVec[grepl('AA', levels(data$label2))] = "red"
barchart(count ~ sample, groups = label2, stack = TRUE, data = data, as.table = TRUE, ylab = "Counts", col=colVec)

Вы хотите "группу" для каждой точки данных, упорядоченную по количеству. Вам просто нужно изменить порядок цветовых векторов в том же порядке, что и сделано с индексированием.

g <- order(data$count)
colVec <- ifelse(data$label=="AA","red","white")[g]
barchart(count ~ sample, groups = factor(1:10,levels=g), 
  stack = TRUE, data = data, col=colVec)
Другие вопросы по тегам