Получение последней записи в каждой группе из базы данных - SQL Server 2005/2008

Я провел некоторые поиски, и, похоже, не могу получить результаты, которые я ищу. По сути, в нашей компании действуют четыре разные системы управления, и я нахожусь в процессе регулярного объединения всех данных из каждой системы. Моя цель - обновлять данные каждый час в центральной базе данных. Вот пример набора данных, с которым я работаю:

COMPUTERNAME | SERIALNUMBER | USERNAME | LASTIP | LASTUPDATE | SOURCE
TEST1 | 1111 | BOB | 1.1.1.1 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST1 | 1111 | BOB | 1.1.1.1 | 1/18/2011 01:00:00 | MGMT_SYSTEM_2
TEST1 | 1111 | PETER | 1.1.1.11 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST2 | 2222 | GEORGE | 1.1.1.2 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST3 | 3333 | TOM | 1.1.1.3 | 1/19/2011 01:00:00 | MGMT_SYSTEM_2
TEST4 | 4444 | MIKE   | 1.1.1.4 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST4 | 4444 | MIKE   | 1.1.1.41 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST5 | 5555 | SUSIE  | 1.1.1.5 | 1/19/2011 01:00:00 | MGMT_SYSTEM_1

Поэтому я хочу запросить эту основную таблицу и получить только последнюю запись (на основе LASTUPDATE), чтобы получить последнюю информацию об этой системе. Проблема в том, что в каждой базе данных может быть одна система, но, конечно, у них никогда не будет одинакового точного времени обновления.

Я ожидаю получить что-то вроде этого:

TEST1 | 1111 | PETER | 1.1.1.11 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST2 | 2222 | GEORGE | 1.1.1.2 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST3 | 3333 | TOM | 1.1.1.3 | 1/19/2011 01:00:00 | MGMT_SYSTEM_2
TEST4 | 4444 | MIKE   | 1.1.1.41 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST5 | 5555 | SUSIE  | 1.1.1.5 | 1/19/2011 01:00:00 | MGMT_SYSTEM_1

Я попытался использовать функцию MAX, но с этим я могу получить только один столбец. И я не могу использовать это в подзапросе, потому что у меня нет уникального поля идентификатора, которое дало бы мне последнюю обновленную запись. Одной из систем является база данных MySQL, и функция MAX в MySQL фактически будет работать так, как мне нужно, чтобы она возвращала только одну запись на GROUP BY, но она не работает в SQL Server.

Я думаю, что мне нужно использовать MAX и LEFT JOIN, но мои попытки пока не увенчались успехом.

Ваша помощь будет принята с благодарностью. Последние 3-4 часа я ломал голову, пытаясь получить рабочий запрос. Эта основная таблица расположена на сервере SQL Server 2005.

Спасибо!

2 ответа

Решение
;with cteRowNumber as (
    select COMPUTERNAME, SERIALNUMBER, USERNAME, LASTIP, LASTUPDATE, SOURCE,
           row_number() over(partition by COMPUTERNAME order by LASTUPDATE desc) as RowNum
        from YourTable
)
select COMPUTERNAME, SERIALNUMBER, USERNAME, LASTIP, LASTUPDATE, SOURCE
    from cteRowNumber
    where RowNum = 1

В SQL Server наиболее эффективным решением часто является коррелированный подзапрос:

select t.*
from t
where t.lastupdate = (select max(t2.lastupdate)
                      from t t2
                      where t2.computername = t.computername
                     );

В частности, это может использовать индекс (computername, lastupdate), Концептуально, причина этого быстрее, чем row_number() потому что этот запрос просто отфильтровывает строки, которые не совпадают. row_number() Версия должна быть привязана к номеру строки во всех строках, прежде чем она будет отфильтрована - это дополнительная обработка данных.

Другие вопросы по тегам