generate_series() не работает должным образом с суммой в PostgreSQL
У меня есть таблица под названием классификация, которая содержит classification_indicator_id
,
Мне нужно подвести итог ID
и положить в 1 день серии.
Мне нужно добавить около 20 столбцов (с другой classification_indicator_id
).
Я немного изменил ответ из предыдущего вопроса:
select
data.d::date as "data",
sum(c.classification_indicator_id)::integer as "Segment1",
sum(c4.classification_indicator_id)::integer as "Segment2",
sum(c5.classification_indicator_id)::integer as "Segment3"
from
generate_series(
'2013-03-25'::timestamp without time zone,
'2013-04-01'::timestamp without time zone,
'1 day'::interval
) data(d)
left join classifications c on (data.d::date = c.created::date and c.classification_indicator_id = 3)
left join classifications c4 on (data.d::date = c4.created::date and c4.classification_indicator_id = 4)
left join classifications c5 on (data.d::date = c5.created::date and c5.classification_indicator_id = 5)
group by "data"
ORDER BY "data"
Но все еще не работает должным образом. sum
для каждой строки это большой и растет, когда я добавляю дополнительные столбцы. Во второй таблице с 4 столбцами в segment1
на 2013-03-26 должно быть столько же, сколько в первой таблице и т. д.
With 3 column With 4 columns
data | Segment1 | Segment2 data | Segment1 | Segment2 | Segment3
-------------------------------- -------------------------------------------
2013-03-25 | 12 | 16 2013-03-25 | 12 | 16 | 20
-------------------------------- -------------------------------------------
2013-03-26 | 18 | 24 2013-03-26 | 108 | 144 | 180
2 ответа
Как отмечено в вашем предыдущем ответе, вы сталкиваетесь с "перекрестным соединением прокси".
Я объяснил это более подробно в этом связанном ответе:
Два SQL LEFT JOINS дают неверный результат
Ваш запрос должен работать так:
SELECT d.created AS data
,c3.segment1
,c4.segment2
,c5.segment3
FROM (
SELECT generate_series('2013-03-25'::date
,'2013-04-01'::date
,interval '1 day')::date AS created
) d
LEFT JOIN (
SELECT created
,sum(classification_indicator_id)::integer AS segment1
FROM classifications
WHERE classification_indicator_id = 3
GROUP BY 1
) c3 USING (created)
LEFT JOIN (
SELECT created
,sum(classification_indicator_id)::integer AS segment2
FROM classifications
WHERE classification_indicator_id = 4
GROUP BY 1
) c4 USING (created)
LEFT JOIN (
SELECT created
,sum(classification_indicator_id)::integer AS segment3
FROM classifications
WHERE classification_indicator_id = 5
GROUP BY 1
) c5 USING (created)
ORDER BY 1;
При условии, что created
это date
не timestamp
,
Или, для еще более быстрого запроса, так как это стало темой:
SELECT d.created AS data
,count(classification_indicator_id = 3 OR NULL)::int * 3 AS segment1
,count(classification_indicator_id = 4 OR NULL)::int * 4 AS segment2
,count(classification_indicator_id = 5 OR NULL)::int * 5 AS segment3
FROM (
SELECT generate_series('2013-03-25'::date
,'2013-04-01'::date
,interval '1 day')::date AS created
) d
LEFT JOIN classifications c USING (created)
GROUP BY 1
ORDER BY 1;
Нет необходимости в соединениях:
select
data.d::date as "data",
sum((classification_indicator_id = 3)::integer * classification_indicator_id)::integer as "Segment1",
sum((classification_indicator_id = 4)::integer * classification_indicator_id)::integer as "Segment2",
sum((classification_indicator_id = 5)::integer * classification_indicator_id)::integer as "Segment3",
from
generate_series(
'2013-03-25'::timestamp without time zone,
'2013-04-01'::timestamp without time zone,
'1 day'::interval
) data(d)
left join
classifications c on data.d::date = c.created::date
group by "data"
ORDER BY "data"