Игнорирование одиночных детей (бамбуковых частей) в иерархическом запросе
У меня есть таблица с иерархическими данными следующим образом.
create table tst as
select 1 id, null parent_id from dual union all
select 2 id, 1 parent_id from dual union all
select 3 id, 1 parent_id from dual union all
select 4 id, 2 parent_id from dual union all
select 5 id, 3 parent_id from dual union all
select 6 id, 5 parent_id from dual union all
select 7 id, 6 parent_id from dual union all
select 8 id, 6 parent_id from dual;
Обойти иерархию тривиально, используя CONNECT BY
заявление.
У меня есть требование извлечения - игнорировать простую (похожую на бамбук) часть дерева, т. Е. Если у родителя есть только один дочерний элемент, оба соединяются, а идентификаторы объединяются (это правило применяется рекурсивно).
Таким образом, ожидаемый результат
ID PARENT_ID
---------- ----------
1
2,4 1
3,5,6 1
7 3,5,6
8 3,5,6
ОБНОВЛЕНИЕ, в качестве альтернативы, это также правильный ответ (добавление связанного списка узлов и повторное использование исходного IDS)
ID PARENT_ID NODE_LST
---------- ---------- ---------
1 1
4 1 2,4
6 1 3,5,6
7 6 7
8 6 8
На данный момент мне удается подсчитать ребенка и построить полный путь к корню подсчета ребенка и идентификаторы...
with child_cnt as (
-- child count per parent
select parent_id, count(*) cnt
from tst
where parent_id is not NULL
group by parent_id),
tst2 as (
select
ID, child_cnt.cnt,
tst.parent_id
from tst left outer join child_cnt on tst.parent_id = child_cnt.parent_id),
tst3 as (
SELECT id, parent_id,
sys_connect_by_path(cnt,',') child_cnt_path,
sys_connect_by_path(id,',') path
FROM tst2
START WITH parent_id IS NULL
CONNECT BY parent_id = PRIOR id
)
select * from tst3
;
ID PARENT_ID CHILD_CNT_PATH PATH
---------- ---------- -------------- ------------
1 , ,1
2 1 ,,2 ,1,2
4 2 ,,2,1 ,1,2,4
3 1 ,,2 ,1,3
5 3 ,,2,1 ,1,3,5
6 5 ,,2,1,1 ,1,3,5,6
7 6 ,,2,1,1,2 ,1,3,5,6,7
8 6 ,,2,1,1,2 ,1,3,5,6,8
Это предполагает, что для идентификаторов 4 и 5 следует пропустить один уровень (один конечный дочерний счет 1), а для идентификатора 6 пропустить 2 уровень (два обучающих в пути подсчета).
Но я думаю, что должен быть более простой подход для решения этой проблемы.
2 ответа
Это не очень элегантно, но должно работать. Я отредактирую, если смогу найти лучший способ сделать заключительную часть. Удачи!
with
d ( id, parent_id, degree ) as (
select id, parent_id, count(parent_id) over (partition by parent_id)
from tst
),
x ( old_id, new_id ) as (
select id, ltrim(sys_connect_by_path(id, ','), ',')
from d
where connect_by_isleaf = 1
start with degree != 1
connect by parent_id = prior id
and degree = 1
)
select x1.new_id as id, x2.new_id as parent_id
from x x1
inner join tst
on tst.id = regexp_substr(x1.new_id, '^[^,]+')
left outer join x x2
on tst.parent_id = x2.old_id
;
Этот запрос приведет вас к альтернативному решению.
Хотя могут быть некоторые дальнейшие оптимизации или исправления ошибок, это работает для вашего тестового примера.
WITH nodes_to_dispose as (
SELECT min(id) as id,
parent_id
FROM tst
WHERE parent_id is not null
GROUP BY parent_id
HAVING count(*) = 1 )
-- This part returns merged bamboo nodes
SELECT nodes_to_dispose.id,
connect_by_root tst.parent_id as parent_id,
connect_by_root nodes_to_dispose.parent_id ||
sys_connect_by_path(nodes_to_dispose.id, ',') as node_lst
FROM nodes_to_dispose, tst
WHERE nodes_to_dispose.parent_id = tst.id (+)
AND connect_by_isleaf = 1
START WITH nodes_to_dispose.parent_id not in (
SELECT id
FROM nodes_to_dispose )
CONNECT BY prior nodes_to_dispose.id = nodes_to_dispose.parent_id
UNION
-- This part returns all other nodes in their original form
SELECT id, parent_id, to_char(id) as node_lst
FROM tst
WHERE id not in (
SELECT parent_id
FROM nodes_to_dispose
UNION
SELECT id
FROM nodes_to_dispose);