Как создать функцию SQL Server для "объединения" нескольких строк из подзапроса в одно поле с разделителями?
Для иллюстрации предположим, что у меня есть две таблицы следующим образом:
VehicleID Name
1 Chuck
2 Larry
LocationID VehicleID City
1 1 New York
2 1 Seattle
3 1 Vancouver
4 2 Los Angeles
5 2 Houston
Я хочу написать запрос, чтобы вернуть следующие результаты:
VehicleID Name Locations
1 Chuck New York, Seattle, Vancouver
2 Larry Los Angeles, Houston
Я знаю, что это можно сделать с помощью серверных курсоров, а именно:
DECLARE @VehicleID int
DECLARE @VehicleName varchar(100)
DECLARE @LocationCity varchar(100)
DECLARE @Locations varchar(4000)
DECLARE @Results TABLE
(
VehicleID int
Name varchar(100)
Locations varchar(4000)
)
DECLARE VehiclesCursor CURSOR FOR
SELECT
[VehicleID]
, [Name]
FROM [Vehicles]
OPEN VehiclesCursor
FETCH NEXT FROM VehiclesCursor INTO
@VehicleID
, @VehicleName
WHILE @@FETCH_STATUS = 0
BEGIN
SET @Locations = ''
DECLARE LocationsCursor CURSOR FOR
SELECT
[City]
FROM [Locations]
WHERE [VehicleID] = @VehicleID
OPEN LocationsCursor
FETCH NEXT FROM LocationsCursor INTO
@LocationCity
WHILE @@FETCH_STATUS = 0
BEGIN
SET @Locations = @Locations + @LocationCity
FETCH NEXT FROM LocationsCursor INTO
@LocationCity
END
CLOSE LocationsCursor
DEALLOCATE LocationsCursor
INSERT INTO @Results (VehicleID, Name, Locations) SELECT @VehicleID, @Name, @Locations
END
CLOSE VehiclesCursor
DEALLOCATE VehiclesCursor
SELECT * FROM @Results
Однако, как вы можете видеть, это требует много кода. То, что я хотел бы, это общая функция, которая позволила бы мне сделать что-то вроде этого:
SELECT VehicleID
, Name
, JOIN(SELECT City FROM Locations WHERE VehicleID = Vehicles.VehicleID, ', ') AS Locations
FROM Vehicles
Это возможно? Или что-то подобное?
13 ответов
Если вы используете SQL Server 2005, вы можете использовать команду FOR XML PATH.
SELECT [VehicleID]
, [Name]
, (STUFF((SELECT CAST(', ' + [City] AS VARCHAR(MAX))
FROM [Location]
WHERE (VehicleID = Vehicle.VehicleID)
FOR XML PATH ('')), 1, 2, '')) AS Locations
FROM [Vehicle]
Это намного проще, чем с помощью курсора, и, кажется, работает довольно хорошо.
Обратите внимание, что код Мэтта приведет к дополнительной запятой в конце строки; использование COALESCE (или ISNULL в этом отношении), как показано в ссылке в сообщении Ланса, использует аналогичный метод, но не оставляет лишней запятой для удаления. Для полноты вот соответствующий код из ссылки Ланса на sqlteam.com:
DECLARE @EmployeeList varchar(100)
SELECT @EmployeeList = COALESCE(@EmployeeList + ', ', '') +
CAST(EmpUniqueID AS varchar(5))
FROM SalesCallsEmployees
WHERE SalCal_UniqueID = 1
Я не верю, что есть способ сделать это в одном запросе, но вы можете разыграть подобные трюки с помощью временной переменной:
declare @s varchar(max)
set @s = ''
select @s = @s + City + ',' from Locations
select @s
Это определенно меньше кода, чем ходить по курсору, и, вероятно, более эффективно.
В одном запросе SQL без использования предложения FOR XML.
Общее табличное выражение используется для рекурсивного объединения результатов.
-- rank locations by incrementing lexicographical order
WITH RankedLocations AS (
SELECT
VehicleID,
City,
ROW_NUMBER() OVER (
PARTITION BY VehicleID
ORDER BY City
) Rank
FROM
Locations
),
-- concatenate locations using a recursive query
-- (Common Table Expression)
Concatenations AS (
-- for each vehicle, select the first location
SELECT
VehicleID,
CONVERT(nvarchar(MAX), City) Cities,
Rank
FROM
RankedLocations
WHERE
Rank = 1
-- then incrementally concatenate with the next location
-- this will return intermediate concatenations that will be
-- filtered out later on
UNION ALL
SELECT
c.VehicleID,
(c.Cities + ', ' + l.City) Cities,
l.Rank
FROM
Concatenations c -- this is a recursion!
INNER JOIN RankedLocations l ON
l.VehicleID = c.VehicleID
AND l.Rank = c.Rank + 1
),
-- rank concatenation results by decrementing length
-- (rank 1 will always be for the longest concatenation)
RankedConcatenations AS (
SELECT
VehicleID,
Cities,
ROW_NUMBER() OVER (
PARTITION BY VehicleID
ORDER BY Rank DESC
) Rank
FROM
Concatenations
)
-- main query
SELECT
v.VehicleID,
v.Name,
c.Cities
FROM
Vehicles v
INNER JOIN RankedConcatenations c ON
c.VehicleID = v.VehicleID
AND c.Rank = 1
Из того, что я вижу FOR XML
(как опубликовано ранее) - единственный способ сделать это, если вы хотите также выбрать другие столбцы (что, я думаю, больше всего будет), как это делает OP. С помощью COALESCE(@var...
не разрешает включение других столбцов.
Обновление: благодаря programmingsolutions.net есть способ удалить запятую в конце. Вводя запятую и используя STUFF
Функция MSSQL позволяет заменить первый символ (начальная запятая) пустой строкой, как показано ниже:
stuff(
(select ',' + Column
from Table
inner where inner.Id = outer.Id
for xml path('')
), 1,1,'') as Values
В SQL Server 2005
SELECT Stuff(
(SELECT N', ' + Name FROM Names FOR XML PATH(''),TYPE)
.value('text()[1]','nvarchar(max)'),1,2,N'')
В SQL Server 2016
Вы можете использовать синтаксис FOR JSON
т.е.
SELECT per.ID,
Emails = JSON_VALUE(
REPLACE(
(SELECT _ = em.Email FROM Email em WHERE em.Person = per.ID FOR JSON PATH)
,'"},{"_":"',', '),'$[0]._'
)
FROM Person per
И результат станет
Id Emails
1 abc@gmail.com
2 NULL
3 def@gmail.com, xyz@gmail.com
Это будет работать, даже если ваши данные содержат недопустимые символы XML
''}, {"": "'является безопасным, потому что если ваши данные содержат'"}, {"": "', они будут экранированы в"},{\"_\":\"
Вы можете заменить ',' на любой разделитель строк
А в SQL Server 2017 база данных SQL Azure
Вы можете использовать новую функцию STRING_AGG
Приведенный ниже код будет работать для Sql Server 2000/2005/2008
CREATE FUNCTION fnConcatVehicleCities(@VehicleId SMALLINT)
RETURNS VARCHAR(1000) AS
BEGIN
DECLARE @csvCities VARCHAR(1000)
SELECT @csvCities = COALESCE(@csvCities + ', ', '') + COALESCE(City,'')
FROM Vehicles
WHERE VehicleId = @VehicleId
return @csvCities
END
-- //Once the User defined function is created then run the below sql
SELECT VehicleID
, dbo.fnConcatVehicleCities(VehicleId) AS Locations
FROM Vehicles
GROUP BY VehicleID
Я нашел решение, создав следующую функцию:
CREATE FUNCTION [dbo].[JoinTexts]
(
@delimiter VARCHAR(20) ,
@whereClause VARCHAR(1)
)
RETURNS VARCHAR(MAX)
AS
BEGIN
DECLARE @Texts VARCHAR(MAX)
SELECT @Texts = COALESCE(@Texts + @delimiter, '') + T.Texto
FROM SomeTable AS T
WHERE T.SomeOtherColumn = @whereClause
RETURN @Texts
END
GO
Использование:
SELECT dbo.JoinTexts(' , ', 'Y')
Ответ Мана не сработал для меня, поэтому я внес некоторые изменения в этот ответ, чтобы заставить его работать. Надеюсь, это кому-нибудь поможет. Использование SQL Server 2012:
SELECT [VehicleID]
, [Name]
, STUFF((SELECT DISTINCT ',' + CONVERT(VARCHAR,City)
FROM [Location]
WHERE (VehicleID = Vehicle.VehicleID)
FOR XML PATH ('')), 1, 2, '') AS Locations
FROM [Vehicle]
С другими ответами человек, читающий ответ, должен знать таблицу транспортных средств и создать таблицу транспортных средств и данные для проверки решения.
Ниже приведен пример, в котором используется таблица "Information_Schema.Columns" SQL Server. Используя это решение, не нужно создавать таблицы или добавлять данные. В этом примере создается список имен столбцов, разделенных запятыми, для всех таблиц в базе данных.
SELECT
Table_Name
,STUFF((
SELECT ',' + Column_Name
FROM INFORMATION_SCHEMA.Columns Columns
WHERE Tables.Table_Name = Columns.Table_Name
ORDER BY Column_Name
FOR XML PATH ('')), 1, 1, ''
)Columns
FROM INFORMATION_SCHEMA.Columns Tables
GROUP BY TABLE_NAME
ВЕРСИЯ ПРИМЕЧАНИЕ. Для этого решения необходимо использовать SQL Server 2005 или более позднюю версию с уровнем совместимости 90 или более.
См. Эту статью MSDN для первого примера создания пользовательской статистической функции, которая объединяет набор строковых значений, взятых из столбца в таблице.
Моя скромная рекомендация - пропустить добавленную запятую, чтобы вы могли использовать свой специальный разделитель, если он есть.
Обращаясь к версии C# примера 1:
change: this.intermediateResult.Append(value.Value).Append(',');
to: this.intermediateResult.Append(value.Value);
А также
change: output = this.intermediateResult.ToString(0, this.intermediateResult.Length - 1);
to: output = this.intermediateResult.ToString();
Таким образом, когда вы используете свой собственный агрегат, вы можете использовать собственный разделитель или вообще не использовать его, например:
SELECT dbo.CONCATENATE(column1 + '|') from table1
ПРИМЕЧАНИЕ. Будьте осторожны с объемом данных, которые вы пытаетесь обработать в своем агрегате. Если вы попытаетесь объединить тысячи строк или много очень больших типов данных, вы можете получить ошибку.NET Framework, в которой говорится, что "[t] его буфер недостаточен".
Если вы работаете с SQL Server 2005, вы можете написать собственную агрегатную функцию CLR, чтобы справиться с этим.
C# версия:
using System;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;
using System.Text;
using Microsoft.SqlServer.Server;
[Serializable]
[Microsoft.SqlServer.Server.SqlUserDefinedAggregate(Format.UserDefined,MaxByteSize=8000)]
public class CSV:IBinarySerialize
{
private StringBuilder Result;
public void Init() {
this.Result = new StringBuilder();
}
public void Accumulate(SqlString Value) {
if (Value.IsNull) return;
this.Result.Append(Value.Value).Append(",");
}
public void Merge(CSV Group) {
this.Result.Append(Group.Result);
}
public SqlString Terminate() {
return new SqlString(this.Result.ToString());
}
public void Read(System.IO.BinaryReader r) {
this.Result = new StringBuilder(r.ReadString());
}
public void Write(System.IO.BinaryWriter w) {
w.Write(this.Result.ToString());
}
}
Попробуйте этот запрос
SELECT v.VehicleId, v.Name, ll.LocationList
FROM Vehicles v
LEFT JOIN
(SELECT
DISTINCT
VehicleId,
REPLACE(
REPLACE(
REPLACE(
(
SELECT City as c
FROM Locations x
WHERE x.VehicleID = l.VehicleID FOR XML PATH('')
),
'</c><c>',', '
),
'<c>',''
),
'</c>', ''
) AS LocationList
FROM Locations l
) ll ON ll.VehicleId = v.VehicleId