Описание тега aggregate
Агрегат - это процесс обобщения сгруппированных данных, обычно используемый в статистике.
1
ответ
KDB: определяемая пользователем функция агрегирования для таблиц
Рассмотрим простую пользовательскую функцию агрегирования MySum:{sum x}и рассмотрим таблицу data:([]y:1 8 27 64 125;x1:1 2 3 4 5;x2:1 4 9 16 25). Почему следующее не работает? select MySum{x}x2 from data `rank
17 дек '14 в 22:17
1
ответ
MongoDB: создавать поля, только если не существует
Я хочу создать скрипт обновления для этих данных: { "_id" : ObjectId("5b87e83d881ba01dfc3b0367"), "Views" : [ { "ReportUniqueKey" : "AAA", "GroupMode" : NumberInt("0"), "DisplayName" : "Default", "Columns" : [], "UnusedOptionalFilterParameter" : nul…
03 сен '18 в 07:39
1
ответ
Быстрее агрегировать несколько столбцов
У меня есть следующая функция, которая запускается сотни раз. Эта агрегация является узким местом в моем коде. Можно ли сделать это быстрее с помощью data.table или переписать эту функцию с помощью rcpp? logit.gr <- function(DT){ temp1 <- DT[,…
09 апр '18 в 17:01
1
ответ
mysql - выбрать самое последнее по значению до даты x, если не после даты x и не в другой таблице
У меня есть таблица т: id, timestamp Существует несколько значений идентификаторов, и несколько строк могут иметь один и тот же идентификатор. Я хочу выбрать самую последнюю строку для каждого идентификатора, до даты x, только если идентификатор не …
08 дек '11 в 21:29
1
ответ
TSQL: поиск уникальных записей в одной таблице
Рассмотрим таблицу или CTE, структурированные так: Name Num ---- ---- Abc 12 Abc 12 XYZ 70 XYZ 80 XYZ 85 Bar 50 Bar 55 Foo 44 Foo 44 Baz 88 Требуется определить Имя, где существует несколько разных номеров. Желаемый результат Name ---- XYZ Bar Какой…
19 апр '10 в 19:29
2
ответа
Хорошо, чтобы обеспечить конструктор + тривиальные операторы для бездействующих агрегатов?
Это дополнительный вопрос к 2043381. Учтите следующее: struct DataBundle { std::string name; int age; DataBundle() : age(0) {} DataBundle(const std::string& name, int age) : name(name), age(age) {} void swap(DataBundle& rhs) {name.swap(rhs.n…
24 янв '10 в 19:07
1
ответ
Значение имеет неверный формат и должно иметь вид ГГГГ-ММ-ДД ЧЧ: ММ
Я работаю с django 1.6 и получаю сообщение об ошибке в последней строке моего кода: start__gte=min_date, start__lte=max_date) Вот ошибка: [U "'start__min' value has an invalid format and must be of the form YYYY-MM-DD HH: MM [: ss [.uuuuuuu]] [TZ]" …
24 фев '17 в 13:31
3
ответа
Получить количество непрерывных вхождений строки в столбце данных на основе другого столбца
Мне нужно выяснить, сколько раз одно значение встречается за другим в столбце определенного фрейма данных. Основная логика заключается в том, чтобы получить отсутствие вхождений определенной строки на основе другого столбца. Например: df<- data.f…
27 мар '15 в 09:35
3
ответа
Агрегировать с использованием "факторов", которые являются NA
Я изо всех сил пытаюсь объединить фрейм данных в формат, который я хочу. Фрейм данных содержит ряд частей, а также список выполненных тестов (длина и ширина), а также нижний и верхний пределы (LL и UL) для каждого измерения. Некоторые из тестов не и…
23 фев '16 в 15:47
3
ответа
Усредните неизвестное количество ответов на респондента; р
Сценарий: у меня есть df, "оценки" нескольких попыток пользователей при прохождении теста. Каждое наблюдение - это попытка с идентификатором пользователя и оценкой. Некоторые пользователи могут передать свою первую попытку, некоторые могут занять не…
06 мар '15 в 22:39
1
ответ
Как выполнить запрос GroupBy Sum к списку?
Фон Я работал с C#.Net + LINQ, где это было возможно, и пробовал свои силы в разработке C++ для проекта, в котором я участвую. Конечно, я полностью осознаю, что C# и C++ - это два разных мира. Вопрос у меня есть std::list<T> где T это структур…
03 сен '18 в 09:08
1
ответ
Как вы можете объединить один столбец на основе всех других столбцов?
У меня есть большое количество файлов CSV, которые содержат данные опроса. В результате я знаю, что есть много дублированных данных. Таким образом, я хочу обобщить данные, найдя частоту уникальных ответов. Обычно я делаю это, вставляя столбец частот…
03 июл '17 в 16:40
2
ответа
MySQL - группа BY GROUP_CONCAT
У меня есть следующий запрос: SELECT issue.`sequence` AS issue_sequence, issue.`description` AS issue_description, GROUP_CONCAT(DISTINCT(issue_category.`name`) SEPARATOR ', ') AS issue_category_name, GROUP_CONCAT(DISTINCT(approach.`name`) SEPARATOR …
11 май '13 в 13:24
1
ответ
Избежание сортировки внешнего диска для совокупного запроса
У нас есть таблица, которая содержит необработанные аналитические данные (например, Google Analytics и аналогичные) для просмотра наших видео. Он содержит числа, такие как необработанные просмотры, загрузки, загрузки и т. Д. Каждое видео идентифицир…
20 окт '14 в 15:11
0
ответов
Агрегат $match не работает с диапазоном дат в узле
Это условие запроса。visitedDate : тип даты const s = new Date('2017/3/1') const e = new Date('2017/3/2') const filter = [ { $match: { dataSource: 0, visitedDate: { $gte: s, $lt: e } } }, { $limit: 10 } ] Я использовал агрегат мангуста в узле, возвра…
14 апр '17 в 10:19
1
ответ
Агрегация нескольких столбцов в искровой Java
У меня есть список столбцов priceColumns это динамично. Я пытаюсь объединить эти столбцы в наборе данных, public Dataset getAgg(RelationalGroupedDataset rlDataset){ Dataset selectedDS=null; for(String priceCol :priceColumns){ selectedDS=rlDataset.ag…
10 сен '18 в 09:21
2
ответа
Агрегатное поведение postgres STDDEV, когда n<2
Мой запрос Postgres вычисляет статистические агрегаты из набора показаний датчика: SELECT to_char(ipstimestamp, 'YYYYMMDDHH24') As row_name, to_char(ipstimestamp, 'FMDD mon FMHH24h') As hour_row_name, varid As category, (AVG(ipsvalue)::NUMERIC(5,2))…
26 июн '12 в 19:35
2
ответа
Агрегация в Excel
Я хочу, чтобы Excel выполнил агрегацию данных на основе справочного столбца: у меня есть данные в Excel, как показано ниже: COL-A COL-B> A 1 B 2 C 3 D 4 A 2 C 1 E 5 F 2 B 3 А ТАКЖЕ Мне нужно, чтобы окончательные значения были агрегированы по COl-…
11 янв '12 в 06:20
1
ответ
MySQL: `GROUP BY`, исключая определенные равные столбцы
По сути, у меня есть данные временных рядов, и мы хотим агрегировать по времени записи. Иногда данные извлекаются несколько раз в течение одной секунды, поэтому при агрегировании значения удваиваются или утраиваются. Есть ли способ, которым я могу g…
26 апр '18 в 15:59
2
ответа
Python Pandas Выборка / агрегация данных
У меня есть дата и время, разделенные запятыми, unique_id набор данных, который выглядит как ниже. datetime, unique_id 2016-09-01 19:50:01, bca8ca1c91d283212faaade44c6185956265cc09 2016-09-01 19:50:02, ddd20611d47597435412739db48b0cb04599e340 2016-0…
20 сен '16 в 02:43