Что такое квантили в ggplot stat_quantile?
Вот мои воспроизводимые данные:
library("ggplot2")
library("ggplot2movies")
library("quantreg")
set.seed(2154)
msamp <- movies[sample(nrow(movies), 1000), ]
Я пытаюсь познакомиться с stat_quantile, но пример из документации поднимает пару вопросов.
mggp <- ggplot(data=msamp, mapping=aes(x=year, y=rating)) +
geom_point() +
stat_quantile(formula=y~x, quantiles=c(0, 0.25, 0.50, 0.75, 1)) +
theme_classic(base_size = 12) +
ylim(c(0,10))
mggp
Насколько я понимаю, квантили делят данные на части, которые меньше, чем определенные пороговые значения, правильно? Если я определяю квантили, как в следующем коде, я получаю пять строк. Зачем? Что они представляют?
Кажется, что квантили рассчитываются на основе зависимой переменной на оси у (рейтинг). Можно ли это изменить? Я имею в виду разделить данные по квантилям на "год"?
1 ответ
Эта функция выполняет квантильную регрессию, и каждая строка является индикатором
Из Википедии:
Квантильная регрессия - это тип регрессионного анализа, используемый в статистике и эконометрике. В то время как метод наименьших квадратов приводит к оценкам, которые аппроксимируют условное среднее значение переменной отклика с учетом определенных значений переменных-предикторов, квантильная регрессия направлена на оценку условной медианы или других квантилей переменной отклика.
Таким образом, каждая линия на графике регрессии является оценкой значения квантиля, например, медиана, 75-й и 100-й процентили.
Вы можете найти подробное техническое обсуждение в виньетке пакета Quantreg.