Описание тега quartile

Квартили - это значения, которые делят список чисел на кварталы.
0 ответов

Рассчитать квартиль, медиану в улье

У меня вопрос, как рассчитать квартиль 1, медиану и квартиль 4 из таблицы улья? допустим, у меня есть такие данные это мой запрос: select hourx,month(datex),percentile_approx(cast(total_trx as BIGINT),array(0.25,0.50,0.75)) from table where month(da…
30 май '18 в 10:32
1 ответ

Как тиражировать 75-процентные и 95% доверительные интервалы SUDAAN по возрастным группам в пакете "обследования" R?

Я пытаюсь воспроизвести квантильные оценки с 95% доверительными интервалами по возрастным группам из SAS и SUDAAN в пакете "опрос" в R с данными NHANES. Функция пакета svyby в сочетании с функцией svyquantile позволяет довольно легко выполнить этот …
05 фев '19 в 20:06
2 ответа

Как рассчитать квартили по группам?

Допустим, у меня есть стол VAL PERSON 1 1 2 1 3 1 4 1 2 2 4 2 6 2 3 3 6 3 9 3 12 3 15 3 И я хотел бы рассчитать квартили для каждого человека. Я понимаю, что могу легко рассчитать их для одного человека как такового: SELECT VAL, NTILE(4) OVER(ORDER …
28 сен '18 в 18:14
1 ответ

Поднабор линий как межквартирных значений в таблице

Я некоторое время оглядывался по сторонам и не смог найти ответы на следующую проблему, связанную с подмножеством. В настоящее время у меня много линий на линейном графике, и я хотел бы только 4 линии, которые демонстрируют: нижний квартиль медиана …
06 июн '16 в 09:07
1 ответ

Почему эти данные CSV усложняются с графиком вискера ggplot2?

Я могу воспроизвести рабочий ggplot2 блокпост с данными теста, но не с данными CSV в R. Данные визуально с единой точкой о событиях (сон и бодрствование) "Vars" , "Sleep", "Awake" "Average" , 7 , 12 "Min" , 4 , 5 "Max" , 10 , 15 Данные в реальной жи…
18 май '17 в 05:12
1 ответ

Используйте R для вычисления медианы без репликации элементов

У меня распределение частот с огромными числами. Я хочу вычислить медиану и квартили, но R жалуется. Вот что работает для небольших номеров: > TABLE <- data.frame(DATA = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19), F = c(48,0,192,1152,5…
29 мар '18 в 16:13
1 ответ

Как вывести разные 25-й, 50-й, 75-й процентили в одном запросе Teradata?

Несколько часов назад я застрял вокруг чего-то похожего и разработал менее грязный код для вывода 25-го, 50-го, 75-го процентиля в одном запросе Teradata. Может быть расширено для получения "5-балльной сводки". Для минимального и максимального измен…
17 янв '17 в 17:55
2 ответа

Ранжирование элементов базы данных по подвижным весам

Так что у меня есть то, что я считаю довольно уникальной проблемой. Мне нужно рассчитать рейтинг для очень большой таблицы предметов (200000). Их "ранг" основан на нескольких взвешенных атрибутах, которые складываются вместе. 7 атрибутов по шкале 1-…
08 июл '15 в 19:09
1 ответ

Единственная ошибка разрывов в расчете квантилей фрейма данных в r

У меня есть датафрейм следующим образом: AA BB CC DD a name1 59.67 45.9 56.64 b name2 0 0 0.3 c name3 7.14 0 0.55000000000000004 Я использую пакет dplyr, и я хотел бы ранжировать каждый столбец в зависимости от его квартиля. Я использую следующую ко…
25 июл '18 в 18:54
1 ответ

Я хочу создать квартили в R для определенной стоимости. Я хочу создать квартили по категориям. Как я могу это сделать?

Например: средняя цена для категорий A и B равна X и Y соответственно. Обе категории содержат количество продуктов. Я хочу создать квартиль на основе средней цены для каждой категории.
09 ноя '15 в 11:54
1 ответ

Создание четвертичного столбца с использованием среднего значения по наблюдениям вместо значения строки

У меня есть временные ряды данных панели, и я хотел бы создать переменную с квартилем среднего значения данной переменной, чтобы фирма могла быть найдена только в данном квартиле. Например, если у меня есть 4 компании: df = id year value Quartile* Q…
31 авг '17 в 16:15
0 ответов

Оптимизация работы с панелями данных с помощью qcut

Я пытаюсь преобразовать столбцы данных в сгруппированные данные. Это использует панды qcut: # Get first column to quartile firstCol = df.columns.get_loc(411.447817504) # Get column num of first wavelength # We need the list of column titles. cols = …
28 фев '19 в 02:47
1 ответ

Функция квартиля терадата (или ANSI SQL)

Есть ли простой способ кодирования квартильной функции SQL? Допустим, у меня есть список значений столбца в таблице (0,0,0,1,1,4,5,7,8,25,100,100,101,260,360,370} Какой хороший способ создать набор результатов а-ля: select 'Q1', quartile(1,col_name)…
10 июн '16 в 01:31
1 ответ

Непрерывные квантили диаграммы рассеяния

У меня есть набор данных, для которого я составил регрессию (используя ggplot2"s stat_smooth): ggplot(data = mydf, aes(x=time, y=pdm)) + geom_point() + stat_smooth(col="red") Я также хотел бы, чтобы квантили (если проще, подойдут только квартили) ис…
30 мар '16 в 16:57
2 ответа

Формула или функции для поиска верхнего и нижнего квартилей в SQL Server

Я пытаюсь получить верхний квартиль, средний и нижний квартиль в SQL Server. Есть ли какая-либо функция или формула? Пожалуйста, совет - большое спасибо
29 мар '17 в 14:41
2 ответа

Функция окна SQL - как обрабатывать, поскольку не удалось сгруппировать по

Это моя первая публикация здесь. Я спокойно просматривал форум в течение нескольких месяцев. Я пытаюсь показать название категории, квартиль и количество названий на квартиль. Это мой код SQL: SELECT name, standard_quartile, count FROM (SELECT c.nam…
20 авг '18 в 06:29
1 ответ

Среднее квартиля для нескольких столбцов и нескольких дат

Я пытаюсь найти средний прямой возврат (столбец fwd_rtn) каждого квартиля для каждого столбца (т. Е. Для квартилей для PB, PE, PS) для каждой группы дат (01.01.2016... 04.01.2016) head(df) Дата Цена акций PB PE PS fwd_rtn1 1/1/2016 A 11,90 0,4 0,10 …
14 апр '16 в 09:44
0 ответов

Четвертая неопределенность в R

У меня есть этот код в R: data <- c(55, 64, 68, 74, 78, 80, 84, 90, 93, 95) summary(data) Я ожидал Median быть 79, 1st Quartile быть 68 а также 3rd Quartile быть 90 согласно моим предыдущим знаниям. Что я получил в качестве выхода 79 для медианы,…
03 апр '18 в 18:48
1 ответ

Найти квартиль диапазона на основе значения в другом столбце

У меня есть следующие данные в Excel, начиная с ячейки A1. Я хочу найти 25-й процентиль (квартиль 1) данных "Время", основанных на месяце. Например, каков 1 квартиль данных времени за 17 апреля? Я написал эту формулу, но она не сработала. Какую форм…
09 май '18 в 18:01
1 ответ

np.percentile не равно квартилям

Я пытаюсь рассчитать квартили для массива значений в Python, используя numpy, X = [1, 1, 1, 3, 4, 5, 5, 7, 8, 9, 10, 1000] Я бы сделал следующее: quartiles = np.percentile(X, range(0, 100, 25)) quartiles # array([1. , 2.5 , 5. , 8.25]) Но это неверн…
16 мар '17 в 15:38