SQL-запрос для поиска самой ранней даты, зависящей от изменения значения столбца
У меня проблема, когда мне нужно получить самое раннее значение даты из таблицы, сгруппированной по столбцу, но последовательно сгруппированной.
Вот пример таблицы:
if object_id('tempdb..#tmp') is NOT null
DROP TABLE #tmp
CREATE TABLE #tmp
(
UserID BIGINT NOT NULL,
JobCodeID BIGINT NOT NULL,
LastEffectiveDate DATETIME NOT NULL
)
INSERT INTO #tmp VALUES ( 1, 5, '1/1/2010')
INSERT INTO #tmp VALUES ( 1, 5, '1/2/2010')
INSERT INTO #tmp VALUES ( 1, 6, '1/3/2010')
INSERT INTO #tmp VALUES ( 1, 5, '1/4/2010')
INSERT INTO #tmp VALUES ( 1, 1, '1/5/2010')
INSERT INTO #tmp VALUES ( 1, 1, '1/6/2010')
SELECT JobCodeID, MIN(LastEffectiveDate)
FROM #tmp
WHERE UserID = 1
GROUP BY JobCodeID
DROP TABLE [#tmp]
Этот запрос вернет 3 строки с минимальным значением.
1 2010-01-05 00:00:00.000
5 2010-01-01 00:00:00.000
6 2010-01-03 00:00:00.000
Я ищу, чтобы группа была последовательной и возвращала более одного JobCodeID, например:
5 2010-01-01 00:00:00.000
6 2010-01-03 00:00:00.000
5 2010-01-04 00:00:00.000
1 2010-01-05 00:00:00.000
Это возможно без курсора?
2 ответа
SELECT JobCodeId, MIN(LastEffectiveDate) AS mindate
FROM (
SELECT *,
prn - rn AS diff
FROM (
SELECT *,
ROW_NUMBER() OVER (PARTITION BY JobCodeID
ORDER BY LastEffectiveDate) AS prn,
ROW_NUMBER() OVER (ORDER BY LastEffectiveDate) AS rn
FROM @tmp
) q
) q2
GROUP BY
JobCodeId, diff
ORDER BY
mindate
Непрерывные диапазоны имеют одинаковую разницу между разделенными и не разделенными ROW_NUMBERs
,
Вы можете использовать это значение в GROUP BY
,
Смотрите эту статью в моем блоге для более подробной информации о том, как это работает:
Первый комментарий - лучше использовать табличную переменную, а не временную таблицу. Тогда вы можете использовать такой трюк. Убедитесь, что вы вставляете значения в правильном порядке (т.е. по возрастанию LastEffectiveDate):
DECLARE @tmp table
(
Sequence INT IDENTITY,
UserID BIGINT,
JobCodeID BIGINT,
LastEffectiveDate DATETIME
)
INSERT INTO @tmp VALUES ( 1, 5, '1/1/2010')
INSERT INTO @tmp VALUES ( 1, 5, '1/2/2010')
INSERT INTO @tmp VALUES ( 1, 6, '1/3/2010')
INSERT INTO @tmp VALUES ( 1, 5, '1/4/2010')
INSERT INTO @tmp VALUES ( 1, 1, '1/5/2010')
INSERT INTO @tmp VALUES ( 1, 1, '1/6/2010')
SELECT TOP 1 JobCodeID, LastEffectiveDate
FROM @tmp
UNION ALL
SELECT t2.JobCodeID, t2.LastEffectiveDate
FROM @tmp t1
INNER JOIN
@tmp t2
ON t1.Sequence + 1 = t2.Sequence
WHERE t1.JobCodeID <> t2.JobCodeID
Это выводит первую дату каждый раз, когда меняется код задания, что, я думаю, именно то, что вы хотите от вашего описания.