MySQL: как найти листья в конкретном узле
Я знаю, что такие добрые вопросы публиковались здесь много раз, например: Java way
У меня есть огромное количество данных (150k+) в стандартной схеме дерева (id
, parent_id
, some_data
)
Вопрос: Как получить листья для данного node_id?
Структура таблицы:
CREATE TABLE `DATA_TREE` (
`ID` int(11) NOT NULL,
`PARENT_ID` int(11) NOT NULL,
`DATA` varchar(45) DEFAULT NULL,
PRIMARY KEY (`ID`),
UNIQUE KEY `ID_UNIQUE` (`ID`),
KEY `fk_DATA_TREE_1_idx` (`PARENT_ID`),
CONSTRAINT `fk_DATA_TREE_1` FOREIGN KEY (`PARENT_ID`) REFERENCES `DATA_TREE` (`ID`) ON DELETE NO ACTION ON UPDATE NO ACTION
) ENGINE=InnoDB DEFAULT CHARSET=utf
База данных: MySQL 5.1.61
1 ответ
Нет способа сделать это в одном запросе. Даже если бы это было, это было бы очень неэффективно.
Мы можем сделать это с помощью хранимой процедуры и цикла. С добавленными вами индексами это тоже должно быть довольно быстро. При этом используются две таблицы, выбирающие узлы из входной таблицы (A) и вставляющие узел и их дочерние элементы в (B). Затем он меняет B на A и повторяется до тех пор, пока в A. не останется больше неконечных узлов. Приятно то, что итераций цикла будет только столько, сколько их уровней между входным узлом и последним листовым узлом, что в большинстве случаев вероятно, не так глубоко. Эта хранимая процедура будет быстрее, чем внешне в коде.
К вашему сведению, у меня были проблемы с установкой, обрабатывающей временные таблицы, если вы получите сообщение об ошибке 2, удалите временное ключевое слово.
delimiter $$
drop procedure if exists GetLeafNodes $$
create procedure GetLeafNodes(nodeid int)
begin
declare N int default 1;
-- create two working sets of IDs, we'll go back and forth between these two sets
drop temporary table if exists A;
drop temporary table if exists B;
create temporary table A(node int, child int);
create temporary table B(node int, child int);
-- insert our single input node into the working set
insert into A values (null, nodeid);
while (N>0) do
-- keep selecting child nodes for each node we are now tracking
-- leaf nodes will end up with the child set to null
insert into B
select ifnull(A.child,A.node), tree.ID
from A
left outer join DATA_TREE as tree on A.child=tree.parent_id;
-- now swap A and B
rename table A to temp, B to A, temp to B;
-- remove non-leaf nodes from table B
delete from B;
-- exit when there are no longer any non-leaf nodes in A
set N=(select count(*) from A where child is not null);
end while;
-- now output our list of leaf nodes
select node from A;
drop temporary table A;
drop temporary table B;
end $$
DELIMITER ;
call GetLeafNodes(4);
Я использовал следующий набор образцов для тестирования:
CREATE TABLE `DATA_TREE` (
`ID` int(11) NOT NULL,
`PARENT_ID` int(11) NOT NULL,
PRIMARY KEY (`ID`),
UNIQUE KEY `ID_UNIQUE` (`ID`),
KEY `fk_DATA_TREE_1_idx` (`PARENT_ID`)
) ENGINE=InnoDB
;
insert into DATA_TREE values
(1,0),(2,1),(3,1),(4,1),(5,3),(6,3),(7,4),(8,4),(9,4),(10,6),(11,6),(12,7),(13,9),(14,9),(15,12),(16,12),(17,12),(18,14);