Как установить значение поля составной переменной с помощью динамического SQL
Учитывая этот тип:
-- Just for testing purposes:
CREATE TYPE testType as (name text)
Я могу получить значение поля динамически с помощью этой функции:
CREATE OR REPLACE FUNCTION get_field(object anyelement, field text) RETURNS text as
$BODY$
DECLARE
value text;
BEGIN
EXECUTE 'SELECT $1."' || field || '"'
USING object
INTO value;
return value;
END;
$BODY$
LANGUAGE plpgsql
призвание get_field('(david)'::testType, 'name')
работает, как и ожидалось, возвращая "Дэвид".
Но как я могу установить значение поля в составном типе? Я пробовал эти функции:
CREATE OR REPLACE FUNCTION set_field_try1(object anyelement, field text, value text)
RETURNS anyelement
as
$BODY$
DECLARE
value text;
BEGIN
EXECUTE '$1."' || field || '" := $2'
USING object, value;
return object;
END;
$BODY$
LANGUAGE plpgsql
CREATE OR REPLACE FUNCTION set_field_try2(object anyelement, field text, value text)
RETURNS anyelement
as
$BODY$
DECLARE
value text;
BEGIN
EXECUTE 'SELECT $1 INTO $2."' || field || '"'
USING value, object;
return object;
END;
$BODY$
LANGUAGE plpgsql
CREATE OR REPLACE FUNCTION set_field_try3(object anyelement, field text, value text)
RETURNS anyelement
as
$BODY$
DECLARE
value text;
BEGIN
EXECUTE 'BEGIN $1."' || field || '" := $2; SELECT $1; END;'
INTO object
USING value, object;
return object;
END;
$BODY$
LANGUAGE plpgsql
и некоторые варианты. призвание set_field_tryX
не работает Я всегда получаю "ОШИБКА: синтаксическая ошибка в или около...". Как я могу сделать это?
Заметки:
- Параметр
anyelement
и поле может быть любым полем в составном типе. Я не могу просто использовать object.name. - Я обеспокоен внедрением SQL. Любой совет в этом был бы оценен, но это не мой вопрос.
6 ответов
Быстрее с hstore
Начиная с Postgres 9.0, с дополнительным модулем hstore
в вашей базе данных есть очень простое и быстрое решение с #=
оператор, который...
заменить поля [s] в
record
с соответствующими значениями изhstore
,
Чтобы установить модуль:
CREATE EXTENSION hstore;
Примеры:
SELECT my_record #= '"field"=>"value"'::hstore; -- with string literal
SELECT my_record #= hstore(field, value); -- with values
Значения должны быть приведены к text
и обратно, очевидно.
Пример функций plpgsql с более подробной информацией:
Почти так же быстро с json
Существуют похожие, но в настоящее время недокументированные (по состоянию на стр. 9.5) решения с json
(стр. 9,3+) или jsonb
(стр. 9.4+), встроенный в Postgres, поэтому вам не нужен дополнительный модуль.
Смотрите @Geir's добавленный ответ для деталей.
Без hstore
а также json
Если вы используете более старую версию или не можете установить дополнительный модуль hstore
или не могу предположить, что он установлен, вот улучшенная версия того, что я опубликовал ранее. Все еще медленнее, чем hstore
оператор, хотя:
CREATE OR REPLACE FUNCTION f_setfield(INOUT _comp_val anyelement
, _field text, _val text)
RETURNS anyelement AS
$func$
BEGIN
EXECUTE 'SELECT ' || array_to_string(ARRAY(
SELECT CASE WHEN attname = _field
THEN '$2'
ELSE '($1).' || quote_ident(attname)
END AS fld
FROM pg_catalog.pg_attribute
WHERE attrelid = pg_typeof(_comp_val)::text::regclass
AND attnum > 0
AND attisdropped = FALSE
ORDER BY attnum
), ',')
USING _comp_val, _val
INTO _comp_val;
END
$func$ LANGUAGE plpgsql STABLE;
Вызов:
CREATE TEMP TABLE t( a int, b text); -- Composite type for testing
SELECT f_setfield(NULL::t, 'a', '1');
Заметки
Явное приведение значения
_val
если в целевом типе данных нет необходимости, строковый литерал в динамическом запросе будет приведен автоматически, исключая подзапрос приpg_type
, Но я сделал еще один шаг вперед:замещать
quote_literal(_val)
с прямой вставкой значения черезUSING
пункт. Сохраняет один вызов функции и два приведения, и в любом случае безопаснее.text
автоматически приводится к целевому типу в современном PostgreSQL. (Не тестировал с версиями до 9.1.)array_to_string(ARRAY())
быстрее чемstring_agg()
,Переменные не нужны, нет
DECLARE
, Меньше заданий.Нет подзапроса в динамическом SQL.
($1).field
быстрее.pg_typeof(_comp_val)::text::regclass
делает так же, как(SELECT typrelid FROM pg_catalog.pg_type WHERE oid = pg_typeof($1)::oid)
для допустимых составных типов, просто быстрее.
Эта последняя модификация построена на предположении, чтоpg_type.typname
всегда идентичен связанномуpg_class.relname
для зарегистрированных составных типов, и двойное приведение может заменить подзапрос. Я запустил этот тест в большой базе данных для проверки, и он оказался пустым, как и ожидалось:SELECT * FROM pg_catalog.pg_type t JOIN pg_namespace n ON n.oid = t.typnamespace WHERE t.typrelid > 0 -- exclude non-composite types AND t.typrelid IS DISTINCT FROM (quote_ident(n.nspname ) || '.' || quote_ident(typname))::regclass
Использование
INOUT
параметр устраняет необходимость явногоRETURN
, Это просто обозначение. Павлу это не понравится, он предпочитает явноеRETURN
заявление...
Все вместе это почти в два раза быстрее, чем в предыдущей версии.
Оригинальный (устаревший) ответ:
В результате получается версия, которая в ~ 2,25 раза быстрее. Но я, вероятно, не смог бы сделать это, не опираясь на вторую версию Павла.
Кроме того, эта версия позволяет избежать большей части приведения к тексту и обратно, делая все в пределах одного запроса, поэтому она должна быть намного менее подвержена ошибкам.
Протестировано с PostgreSQL 9.0 и 9.1.
CREATE FUNCTION f_setfield(_comp_val anyelement, _field text, _val text)
RETURNS anyelement AS
$func$
DECLARE
_list text;
BEGIN
_list := (
SELECT string_agg(x.fld, ',')
FROM (
SELECT CASE WHEN a.attname = $2
THEN quote_literal($3) || '::'|| (SELECT quote_ident(typname)
FROM pg_catalog.pg_type
WHERE oid = a.atttypid)
ELSE quote_ident(a.attname)
END AS fld
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_catalog.pg_type
WHERE oid = pg_typeof($1)::oid)
AND a.attnum > 0
AND a.attisdropped = false
ORDER BY a.attnum
) x
);
EXECUTE 'SELECT ' || _list || ' FROM (SELECT $1.*) x'
USING $1
INTO $1;
RETURN $1;
END
$func$ LANGUAGE plpgsql STABLE;
Я написал вторую версию функции setfield. Это работает на Postgres 9.1 Я не тестировал его на старых версиях. Это не чудо (с точки зрения производительности), но он более надежен и примерно в 8 раз быстрее предыдущего.
CREATE OR REPLACE FUNCTION public.setfield2(anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
DECLARE
_name text;
_values text[];
_value text;
_attnum int;
BEGIN
FOR _name, _attnum
IN SELECT a.attname, a.attnum
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_type
WHERE oid = pg_typeof($1)::oid)
AND a.attnum > 0
LOOP
IF _name = $2 THEN
_value := $3;
ELSE
EXECUTE 'SELECT (($1).' || quote_ident(_name) || ')::text' INTO _value USING $1;
END IF;
_values[_attnum] := COALESCE('"' || replace(replace(_value, '"', '""'), '''', '''''') || '"', '');
END LOOP;
EXECUTE 'SELECT (' || quote_ident(pg_typeof($1)::text) || ' ''(' || array_to_string(_values,',') || ')'').*' INTO $1;
RETURN $1;
END;
$function$;
ОБНОВЛЕНИЕ / предостережение: Эрвин отмечает, что это в настоящее время не документировано, а в руководстве указывается, что изменение записей таким способом не должно быть возможным.
Вместо этого используйте hstore или решение Павла.
Это простое решение на основе json почти так же быстро, как и hstore, и требует только Postgres 9.3 или новее. Это должно быть хорошим вариантом, если вы не можете использовать расширение hstore, и разница в производительности должна быть незначительной. Тесты: /questions/38344167/kak-ustanovit-znachenie-polya-sostavnoj-peremennoj-s-pomoschyu-dinamicheskogo-sql/38344185#38344185
а) Мы можем сделать это встроенным путем приведения / конкатата. Функция Json требует Postgres 9.3:
SELECT json_populate_record(
record
, ('{"'||'key'||'":"'||'new-value'||'"}')::json
);
б) или встроенный, используя функции Postgres 9.4.
SELECT json_populate_record (
record
,json_object(ARRAY['key', 'new-value'])
);
Примечание: я выбрал json_object(ARRAY[ключ, значение]), так как он был немного быстрее, чем json_build_object (ключ, значение):
Чтобы скрыть детали заливки, вы можете использовать a) в функции с небольшими накладными расходами.
CREATE FUNCTION x.setfield_json(in_element anyelement, key text, value text)
RETURNS anyelement AS
$BODY$
SELECT json_populate_record( in_element, ('{"'||key||'":"'||value||'"}')::json);
$BODY$ LANGUAGE sql;
"SELECT INTO" вне plpgsql (в контексте динамического SQL) имеет иной смысл, чем вы ожидаете - он сохраняет результат запроса в таблицу.
Модификация любого поля возможна, но не проста
CREATE OR REPLACE FUNCTION public.setfield(a anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
begin
create temp table aux as select $1.*;
execute 'update aux set ' || quote_ident($2) || ' = ' || quote_literal($3);
select into $1 * from aux;
drop table aux;
return $1;
end;
$function$
Но этот код не очень эффективен - невозможно написать это хорошо в plpgsql. Вы можете найти некоторую библиотеку C, которая должна сделать.
Тестовая настройка и тесты v2
Эрвин призвал воспроизвести свой тест в этой теме ( /questions/38344167/kak-ustanovit-znachenie-polya-sostavnoj-peremennoj-s-pomoschyu-dinamicheskogo-sql/38344182#38344182), поэтому я модифицировал его код синтетическими тестовыми данными и добавил из моего ответа решение hstore и решение json (и решение json от Павла найдено в другой ветке) Теперь тест выполняется как один запрос, что упрощает сбор результатов.
DROP SCHEMA IF EXISTS x CASCADE;
CREATE SCHEMA x;
-- Pavel 1:
--------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION x.setfield(anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
begin
create temp table aux as select $1.*;
execute 'update aux set ' || quote_ident($2) || ' = ' || quote_literal($3);
select into $1 * from aux;
drop table aux;
return $1;
end;
$function$;
-- Pavel 2 (with patches)
--------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION x.setfield2(anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
DECLARE
_name text;
_values text[];
_value text;
_attnum int;
BEGIN
FOR _name, _attnum
IN SELECT a.attname, a.attnum
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_type
WHERE oid = pg_typeof($1)::oid)
LOOP
IF _name = $2 THEN
_value := $3;
ELSE
EXECUTE 'SELECT (($1).' || quote_ident(_name) || ')::text' INTO _value USING $1;
END IF;
_values[_attnum] := COALESCE('"' || replace(replace(_value, '"', '""'), '''', '''''') || '"', '');
END LOOP;
EXECUTE 'SELECT (' || pg_typeof($1)::text || '''(' || array_to_string(_values,',') || ')'').*' INTO $1;
RETURN $1;
END;
$function$;
-- Erwin 1
--------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION x.setfield3(anyelement, text, text)
RETURNS anyelement
AS $body$
DECLARE
_list text;
BEGIN
_list := (
SELECT string_agg(x.fld, ',')
FROM (
SELECT CASE WHEN a.attname = $2
THEN quote_literal($3)
ELSE quote_ident(a.attname)
END AS fld
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_type
WHERE oid = pg_typeof($1)::oid)
ORDER BY a.attnum
) x
);
EXECUTE '
SELECT ' || _list || '
FROM (SELECT $1.*) x'
USING $1
INTO $1;
RETURN $1;
END;
$body$ LANGUAGE plpgsql;
-- Erwin 2
--------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION x.setfield4(INOUT _comp_val anyelement
, _field text, _val text)
RETURNS anyelement AS
$func$
BEGIN
EXECUTE 'SELECT ' || array_to_string(ARRAY(
SELECT CASE WHEN attname = _field
THEN '$2'
ELSE '($1).' || quote_ident(attname)
END AS fld
FROM pg_catalog.pg_attribute
WHERE attrelid = pg_typeof(_comp_val)::text::regclass
AND attnum > 0
AND attisdropped = FALSE
ORDER BY attnum
), ',')
USING _comp_val, _val
INTO _comp_val;
END
$func$ LANGUAGE plpgsql;
-- Pavel 3: json. (Postgres 9.4)
-- Found here: https://stackru.com/a/28284491/1914376
--------------------------------------------------------------------------------------------------
CREATE OR REPLACE FUNCTION x.setfield5(r anyelement, fn text, val text,OUT result anyelement)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
declare jo json;
begin
jo := (select json_object(array_agg(key),
array_agg(case key when fn then val
else value end))
from json_each_text(row_to_json(r)));
result := json_populate_record(r, jo);
end;
$function$;
-- Json. Use built-in json functions (Postgres 9.3)
-- This is available from 9.3 since we create json by casting
-- instead of using json_object/json_build_object only available from 9.4
--------------------------------------------------------------------------------------------------
CREATE FUNCTION x.setfield_json(in_element anyelement, key text, value text)
RETURNS anyelement AS
$BODY$
SELECT json_populate_record( in_element, ('{"'||key||'":"'||value||'"}')::json);
$BODY$ LANGUAGE sql;
--------------------------------------------------------------------------------------------------
-- Test setup
--------------------------------------------------------------------------------------------------
-- composite type for tests.
CREATE TYPE x.t_f as (
id int
,company text
,sort text
,log_up timestamp
,log_upby smallint
);
-- Create temp table with synthetic test data
DROP TABLE IF EXISTS tmp_f;
CREATE TEMP table tmp_f AS
SELECT ROW(i, 'company'||i, NULL, NULL, NULL)::x.t_f AS f
FROM generate_series(1, 5000) S(i);
-- Run the benchmark
DO $$ DECLARE start_time timestamptz; test_count integer; test_description TEXT; BEGIN
test_count := 200;
test_description := 'setfield, Pavel 1: temptable';
start_time := clock_timestamp();
PERFORM x.setfield (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'setfield2, Pavel 2: reflection';
start_time := clock_timestamp();
PERFORM x.setfield2 (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'setfield3, Erwin 1: reflection';
start_time := clock_timestamp();
PERFORM x.setfield3 (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'setfield4, Erwin 2: reflection';
start_time := clock_timestamp();
PERFORM x.setfield4 (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'setfield5, Pavel 3: json (PG 9.4)';
start_time := clock_timestamp();
PERFORM x.setfield5 (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'setfield_json, Geir 1: casting (PG 9.3)';
start_time := clock_timestamp();
PERFORM x.setfield_json (f, 'company','new-value-'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
--json_object(ARRAY(key,value]) is actually faster than json_build_object(key, value)
test_count := 5000;
test_description := 'no function/inlined: json_object (PG 9.4)';
start_time := clock_timestamp();
PERFORM json_populate_record( f, json_object(ARRAY['company', 'new-value'||md5(random()::text)] )) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
test_count := 5000;
test_description := 'no function/inlined: hstore (PG 9.0)';
start_time := clock_timestamp();
PERFORM f #= hstore('company', 'new-value'||md5(random()::text)) FROM tmp_f LIMIT test_count;
RAISE NOTICE 'Test took: % ms (for % rows) Name: %', extract(MILLISECONDS FROM (clock_timestamp() - start_time))::INTEGER, test_count, test_description;
END; $$;
Результаты тестов на 9.4.1, win32, i5-4300U
NOTICE: Test took: 1138 ms (for 200 rows) Name: setfield, Pavel 1: temptable
NOTICE: Test took: 652 ms (for 5000 rows) Name: setfield2, Pavel 2: reflection
NOTICE: Test took: 364 ms (for 5000 rows) Name: setfield3, Erwin 1: reflection
NOTICE: Test took: 275 ms (for 5000 rows) Name: setfield4, Erwin 2: reflection
NOTICE: Test took: 192 ms (for 5000 rows) Name: setfield5, Pavel 3: json (PG 9.4)
NOTICE: Test took: 23 ms (for 5000 rows) Name: setfield_json, Geir 1: casting (PG 9.3)
NOTICE: Test took: 25 ms (for 5000 rows) Name: no function/inlined: json_object (PG 9.4)
NOTICE: Test took: 14 ms (for 5000 rows) Name: no function/inlined: hstore (PG 9.0)
Обновление март 2015:
Во многом устарел сейчас. Рассмотрим новый тест @Geir с более быстрыми вариантами.
Тестовая настройка и тесты
Я взял три представленных решения (до 16 октября 2011 г.) и провел тест на PostgreSQL 9.0. Вы найдете полную настройку ниже. Только тестовые данные не включены, так как я использовал реальную базу данных (не синтетические данные). Все это заключено в собственную схему для ненавязчивого использования.
Я хотел бы призвать любого, кто хочет воспроизвести тест. Может быть, с Postgres 9,1? И добавить свои результаты здесь?:)
-- DROP SCHEMA x CASCADE;
CREATE SCHEMA x;
-- Pavel 1
CREATE OR REPLACE FUNCTION x.setfield(anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
begin
create temp table aux as select $1.*;
execute 'update aux set ' || quote_ident($2) || ' = ' || quote_literal($3);
select into $1 * from aux;
drop table aux;
return $1;
end;
$function$;
-- Pavel 2 (with patches)
CREATE OR REPLACE FUNCTION x.setfield2(anyelement, text, text)
RETURNS anyelement
LANGUAGE plpgsql
AS $function$
DECLARE
_name text;
_values text[];
_value text;
_attnum int;
BEGIN
FOR _name, _attnum
IN SELECT a.attname, a.attnum
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_type
WHERE oid = pg_typeof($1)::oid)
LOOP
IF _name = $2 THEN
_value := $3;
ELSE
EXECUTE 'SELECT (($1).' || quote_ident(_name) || ')::text' INTO _value USING $1;
END IF;
_values[_attnum] := COALESCE('"' || replace(replace(_value, '"', '""'), '''', '''''') || '"', '');
END LOOP;
EXECUTE 'SELECT (' || pg_typeof($1)::text || '''(' || array_to_string(_values,',') || ')'').*' INTO $1;
RETURN $1;
END;
$function$;
-- Erwin 1
CREATE OR REPLACE FUNCTION x.setfield3(anyelement, text, text)
RETURNS anyelement
AS $body$
DECLARE
_list text;
BEGIN
_list := (
SELECT string_agg(x.fld, ',')
FROM (
SELECT CASE WHEN a.attname = $2
THEN quote_literal($3)
ELSE quote_ident(a.attname)
END AS fld
FROM pg_catalog.pg_attribute a
WHERE a.attrelid = (SELECT typrelid
FROM pg_type
WHERE oid = pg_typeof($1)::oid)
ORDER BY a.attnum
) x
);
EXECUTE '
SELECT ' || _list || '
FROM (SELECT $1.*) x'
USING $1
INTO $1;
RETURN $1;
END;
$body$ LANGUAGE plpgsql;
-- composite type for tests.
CREATE TYPE x.t_f as (
id int
,company text
,sort text
,log_up timestamp
,log_upby smallint
);
-- temp table with real life test data
DROP TABLE IF EXISTS tmp_f;
CREATE TEMP table tmp_f AS
SELECT ROW(firma_id,firma,sort,log_up,log_upby)::x.t_f AS f
FROM ef.firma
WHERE firma !~~ '"%';
-- SELECT count(*) FROM tmp_f; -- 5183
-- Quick test: results are identical?
SELECT *,
x.setfield (f, 'company','test')
,x.setfield2(f, 'company','test')
,x.setfield3(f, 'company','test')
FROM tmp_f
LIMIT 10;
Ориентиры
Я запускал запросы пару раз, чтобы заполнить кеш. Представленные результаты являются лучшими из пяти общих EXPLAIN ANALYZE
,
Первый раунд с 1000 рядами
Первый прототип Павла максимально увеличивает общую память с большим количеством строк.
Павел 1: 2445,112 мс
SELECT x.setfield (f, 'company','test') FROM tmp_f limit 1000;
Павел 2: 263,753 мс
SELECT x.setfield2(f, 'company','test') FROM tmp_f limit 1000;
Эрвин 1: 120,671 мс
SELECT x.setfield3(f, 'company','test') FROM tmp_f limit 1000;
Еще один тест с 5183 строками.
Павел 2: 1327,429 мс
SELECT x.setfield2(f, 'company','test') FROM tmp_f;
Erwin1: 588,691 мс
SELECT x.setfield3(f, 'company','test') FROM tmp_f;