Что такое квантили в ggplot stat_quantile?

Вот мои воспроизводимые данные:

library("ggplot2")
library("ggplot2movies")
library("quantreg")    
set.seed(2154)
msamp <- movies[sample(nrow(movies), 1000), ]

Я пытаюсь познакомиться с stat_quantile, но пример из документации поднимает пару вопросов.

mggp <- ggplot(data=msamp, mapping=aes(x=year, y=rating)) + 
    geom_point() + 
    stat_quantile(formula=y~x, quantiles=c(0, 0.25, 0.50, 0.75, 1)) + 
    theme_classic(base_size = 12) + 
    ylim(c(0,10))
mggp
  1. Насколько я понимаю, квантили делят данные на части, которые меньше, чем определенные пороговые значения, правильно? Если я определяю квантили, как в следующем коде, я получаю пять строк. Зачем? Что они представляют?

  2. Кажется, что квантили рассчитываются на основе зависимой переменной на оси у (рейтинг). Можно ли это изменить? Я имею в виду разделить данные по квантилям на "год"?

1 ответ

Эта функция выполняет квантильную регрессию, и каждая строка является индикатором

Из Википедии:

Квантильная регрессия - это тип регрессионного анализа, используемый в статистике и эконометрике. В то время как метод наименьших квадратов приводит к оценкам, которые аппроксимируют условное среднее значение переменной отклика с учетом определенных значений переменных-предикторов, квантильная регрессия направлена ​​на оценку условной медианы или других квантилей переменной отклика.

Таким образом, каждая линия на графике регрессии является оценкой значения квантиля, например, медиана, 75-й и 100-й процентили.

Вы можете найти подробное техническое обсуждение в виньетке пакета Quantreg.

введите описание изображения здесь

Другие вопросы по тегам