Создайте блок R в R, который помечает блок с размером выборки (N)
Есть ли способ создать блок-график в R, который будет отображать с блоком (где-то) "N=(размер выборки)"? Логическая переменная ширины регулирует ширину поля в зависимости от размера выборки, но это не позволяет сравнивать различные графики.
FWIW, я использую команду boxplot следующим образом, где 'f1' является фактором:
boxplot(xvar ~ f1, data=frame, xlab="input values", horizontal=TRUE)
5 ответов
Вот некоторый код ggplot2. Он будет отображать размер выборки по среднему значению выборки, делая этикетку многофункциональной!
Во-первых, простая функция для fun.data
give.n <- function(x){
return(c(y = mean(x), label = length(x)))
}
Теперь, чтобы продемонстрировать с данными алмазов
ggplot(diamonds, aes(cut, price)) +
geom_boxplot() +
stat_summary(fun.data = give.n, geom = "text")
Возможно, вам придется поиграть с размером текста, чтобы он выглядел хорошо, но теперь у вас есть метка для размера выборки, которая также дает ощущение перекоса.
Вы можете использовать names
параметр для записи n
рядом с каждым именем фактора.
Если вы не хотите рассчитывать n
сами вы можете использовать этот маленький трюк:
# Do the boxplot but do not show it
b <- boxplot(xvar ~ f1, data=frame, plot=0)
# Now b$n holds the counts for each factor, we're going to write them in names
boxplot(xvar ~ f1, data=frame, xlab="input values", names=paste(b$names, "(n=", b$n, ")"))
Чтобы получить n
на вершине бара, вы можете использовать text
с stat
детали предоставлены boxplot следующим образом
b <- boxplot(xvar ~ f1, data=frame, plot=0)
text(1:length(b$n), b$stats[5,]+1, paste("n=", b$n))
Поле статистики b представляет собой матрицу, каждый столбец содержит экстремум нижнего усика, нижний шарнир, медиану, верхний шарнир и экстремум верхнего усика для одной группы / участка.
gplots
пакет обеспечивает boxplot.n
, который согласно документации выдает коробку с аннотацией с количеством наблюдений.
Я нашел обходной путь, используя пакет Envstats. Этот пакет необходимо загрузить, загрузить и активировать, используя:
library(Envstats)
StripChart (отличается от stripchart) добавляет к диаграмме некоторые значения, такие как значения n. Сначала я построил свой боксплот. Затем я использовал add = T в чередовании полос. Очевидно, что многие вещи были скрыты в коде stripChart, чтобы они не отображались на блокпосте. Вот код, который я использовал для stripChart, чтобы скрыть большинство элементов.
Boxplot со встроенной stripChart для отображения n значений:
stripChart(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1), show.ci=F,axes=F,points.cex=0,n.text.line=1.6,n.text.cex=0.7,add=T,location.scale.text="none")
Итак, боксплот
boxplot(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1),main="All Rheometry Tests on Egg Plasma at All Time Points at 0.1Hz,0.1% and 37 Set 1,2,3", names=c("0h","24h","96h","7d ", "11d", "15d", "30d"),boxwex=0.6,par(mar=c(8,4,4,2)))
Тогда чарт
stripChart(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1), show.ci=F,axes=F,points.cex=0,n.text.line=1.6,n.text.cex=0.7,add=T,location.scale.text="none")
Вы всегда можете отрегулировать максимальное количество чисел (n значений), чтобы они соответствовали, где вы хотите.