Отображение значений данных на гистограмме с накоплением в ggplot2
Я хотел бы показать значения данных на гистограмме с накоплением в ggplot2. Вот мой попытался код
Year <- c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category <- c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <- c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data <- data.frame(Year, Category, Frequency)
library(ggplot2)
p <- qplot(Year, Frequency, data = Data, geom = "bar", fill = Category, theme_set(theme_bw()))
p + geom_text(aes(label = Frequency), size = 3, hjust = 0.5, vjust = 3, position = "stack")
Я хотел бы показать эти значения данных в середине каждой части. Любая помощь в этом отношении будет высоко оценена. Спасибо
4 ответа
От ggplot 2.2.0
этикетки могут быть легко сложены с помощью position = position_stack(vjust = 0.5)
в geom_text
,
ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
geom_bar(stat = "identity") +
geom_text(size = 3, position = position_stack(vjust = 0.5))
Также обратите внимание, что " position_stack()
а также position_fill()
теперь значения стеков в обратном порядке группировки, что делает порядок стеков по умолчанию в соответствии с легендой."
Ответ действителен для более старых версий ggplot
:
Вот один подход, который вычисляет средние точки баров.
library(ggplot2)
library(plyr)
# calculate midpoints of bars (simplified using comment by @DWin)
Data <- ddply(Data, .(Year),
transform, pos = cumsum(Frequency) - (0.5 * Frequency)
)
# library(dplyr) ## If using dplyr...
# Data <- group_by(Data,Year) %>%
# mutate(pos = cumsum(Frequency) - (0.5 * Frequency))
# plot bars and add text
p <- ggplot(Data, aes(x = Year, y = Frequency)) +
geom_bar(aes(fill = Category), stat="identity") +
geom_text(aes(label = Frequency, y = pos), size = 3)
Как уже упоминал Хэдли, есть более эффективные способы передачи вашего сообщения, чем метки в гистограммах с накоплением. На самом деле, составленные диаграммы не очень эффективны, так как столбцы (каждая категория) не имеют общей оси, поэтому сравнение сложно.
В этих случаях почти всегда лучше использовать два графика, имеющих общую ось. В вашем примере я предполагаю, что вы хотите показать общую сумму, а затем пропорции, которые каждая категория внесла в данный год.
library(grid)
library(gridExtra)
library(plyr)
# create a new column with proportions
prop <- function(x) x/sum(x)
Data <- ddply(Data,"Year",transform,Share=prop(Frequency))
# create the component graphics
totals <- ggplot(Data,aes(Year,Frequency)) + geom_bar(fill="darkseagreen",stat="identity") +
xlab("") + labs(title = "Frequency totals in given Year")
proportion <- ggplot(Data, aes(x=Year,y=Share, group=Category, colour=Category))
+ geom_line() + scale_y_continuous(label=percent_format())+ theme(legend.position = "bottom") +
labs(title = "Proportion of total Frequency accounted by each Category in given Year")
# bring them together
grid.arrange(totals,proportion)
Это даст вам 2-х панельный дисплей:
Если вы хотите добавить значения частоты, лучшим форматом будет таблица.
Как показано в ответе @Ramnath, отредактированном @Henrik, передав аргумент вvjust
Параметр относительного положения меток можно настроить, и это хорошо работает для центрированных меток. В самом вопросе @MYaseen208 показывает, как сместить положение меток с помощью вертикального выравнивания. В R выравнивание выполняется относительно ограничивающей рамки текстовой метки, что может привести к тому, что расположение метки будет немного отличаться в зависимости от символов в метке (с выносными элементами, такими как «g», или без таких, как «a»), или когда размер текста или меняется графическое устройство. В зависимости от случая это может быть преимуществом или недостатком.
Здесь я привожу в качестве альтернативного ответа, который в некоторых случаях может быть предпочтительнее, пример поиска текстовых меток, сдвинутых вниз от их исходного положения на постоянное расстояние в единицах данных. Это эквивалентно объединениюposition_stack()
иposition_nudge()
и может быть достигнуто сposition_stacknudge()
из пакета 'ggpp'.
Year <-
c(rep(c("2006-07", "2007-08", "2008-09", "2009-10"), each = 4))
Category <-
c(rep(c("A", "B", "C", "D"), times = 4))
Frequency <-
c(168, 259, 226, 340, 216, 431, 319, 368, 423, 645, 234, 685, 166, 467, 274, 251)
Data <- data.frame(Year, Category, Frequency)
library(ggplot2)
library(ggpp)
ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
geom_bar(stat = "identity") +
geom_text(size = 3, position = position_stacknudge(y = -60))
Создано 03 сентября 2022 г. с использованием репрекса версии 2.0.2.
Для полноты картины здесь решение с использованиемggalluvial::stat_stratum
.
library(ggalluvial)
ggplot(Data, aes(x = Year, y = Frequency, fill = Category, label = Frequency)) +
geom_col() +
geom_text(stat = "stratum", aes(stratum = Category))