Создайте блок R в R, который помечает блок с размером выборки (N)

Есть ли способ создать блок-график в R, который будет отображать с блоком (где-то) "N=(размер выборки)"? Логическая переменная ширины регулирует ширину поля в зависимости от размера выборки, но это не позволяет сравнивать различные графики.

FWIW, я использую команду boxplot следующим образом, где 'f1' является фактором:

boxplot(xvar ~ f1, data=frame, xlab="input values", horizontal=TRUE)

5 ответов

Решение

Вот некоторый код ggplot2. Он будет отображать размер выборки по среднему значению выборки, делая этикетку многофункциональной!

Во-первых, простая функция для fun.data

give.n <- function(x){
   return(c(y = mean(x), label = length(x)))
}

Теперь, чтобы продемонстрировать с данными алмазов

ggplot(diamonds, aes(cut, price)) + 
   geom_boxplot() + 
   stat_summary(fun.data = give.n, geom = "text")

Возможно, вам придется поиграть с размером текста, чтобы он выглядел хорошо, но теперь у вас есть метка для размера выборки, которая также дает ощущение перекоса.

Вы можете использовать names параметр для записи n рядом с каждым именем фактора.

Если вы не хотите рассчитывать n сами вы можете использовать этот маленький трюк:

# Do the boxplot but do not show it
b <- boxplot(xvar ~ f1, data=frame, plot=0)
# Now b$n holds the counts for each factor, we're going to write them in names
boxplot(xvar ~ f1, data=frame, xlab="input values", names=paste(b$names, "(n=", b$n, ")"))

Чтобы получить n на вершине бара, вы можете использовать text с stat детали предоставлены boxplot следующим образом

b <- boxplot(xvar ~ f1, data=frame, plot=0)
text(1:length(b$n), b$stats[5,]+1, paste("n=", b$n))

Поле статистики b представляет собой матрицу, каждый столбец содержит экстремум нижнего усика, нижний шарнир, медиану, верхний шарнир и экстремум верхнего усика для одной группы / участка.

gplots пакет обеспечивает boxplot.n, который согласно документации выдает коробку с аннотацией с количеством наблюдений.

Я нашел обходной путь, используя пакет Envstats. Этот пакет необходимо загрузить, загрузить и активировать, используя:

library(Envstats)

StripChart (отличается от stripchart) добавляет к диаграмме некоторые значения, такие как значения n. Сначала я построил свой боксплот. Затем я использовал add = T в чередовании полос. Очевидно, что многие вещи были скрыты в коде stripChart, чтобы они не отображались на блокпосте. Вот код, который я использовал для stripChart, чтобы скрыть большинство элементов.

Boxplot со встроенной stripChart для отображения n значений:

stripChart(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1), show.ci=F,axes=F,points.cex=0,n.text.line=1.6,n.text.cex=0.7,add=T,location.scale.text="none")

Итак, боксплот

boxplot(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1),main="All Rheometry Tests on Egg Plasma at All Time Points at 0.1Hz,0.1% and 37 Set 1,2,3", names=c("0h","24h","96h","7d ", "11d", "15d", "30d"),boxwex=0.6,par(mar=c(8,4,4,2)))

Тогда чарт

stripChart(data.frame(T0_G1,T24h_G1,T96h_G1,T7d_G1,T11d_G1,T15d_G1,T30d_G1), show.ci=F,axes=F,points.cex=0,n.text.line=1.6,n.text.cex=0.7,add=T,location.scale.text="none")

Вы всегда можете отрегулировать максимальное количество чисел (n значений), чтобы они соответствовали, где вы хотите.

Другие вопросы по тегам