Непоследовательное верхнее расстояние усов с 1,5 IQR
Одни и те же данные, использующие два разных метода боксплота, дают две разные длины для вискеров, я понимаю, что усы доходят только до максимальной (минимальной) точки, меньшей (большей), чем верхнее (нижнее) значение забора. В моем случае они выбирают другую максимальную точку, или забор просчитан. Из того, что я прочитал в документации, оба метода используют 1,5 IRQ, и предел забора должен быть 57,8, поэтому следует выбирать 39, а не 58,8
http://docs.ggplot2.org/0.9.3.1/geom_boxplot.html
https://stat.ethz.ch/R-manual/R-devel/library/grDevices/html/boxplot.stats.html
geom_boxplot
df=data.frame(num=c(81.16469 ,11.59219 ,29.7309 ,86.03547 ,16.42667 ,33.52099 ,26.07814 ,30.91522 ,39.49079 ,31.634 ,37.8732 ,20.50268 ,16.9127 ,20.1115 ,23.74309 ,22.30444 ,24.21399 ,27.30867 ,39.07071 ,14.81049 ,21.42116 ,23.30437 ,17.94871 ,17.50281 ,58.82008 ,20.18478 ,10.65572 ,37.97092 ,25.16336 ,35.69668))
quantile(df$num)
0% 25% 50% 75% 100%
10.65572 20.12982 24.68867 35.15276 86.03547
boxplot(df$num)
IQR(df$num)*1.5+quantile(df$num)[4]
75%
57.68716
ggplot(df,aes("x",num))+geom_boxplot()
boxplot(df$num)
И что более важно, я хочу извлечь из df$num
статистика (вектор длиной 5, содержащий экстремум нижнего усика, нижний "шарнир", медиану, верхний "шарнир" и экстремум верхнего усика) с использованием любой функции, поэтому я могу добавить текст в ggplot
в определенных местах. boxplot.stats(df$num)$stats
ниже приведены эти характеристики, но верхний усы не соответствует моему ggplot
Результаты.
boxplot.stats(df$num)$stats
[1] 10.65572 20.11150 24.68867 35.69668 58.82008