MySQL: как найти листья в конкретном узле

Я знаю, что такие добрые вопросы публиковались здесь много раз, например: Java way

У меня есть огромное количество данных (150k+) в стандартной схеме дерева (id, parent_id, some_data)

Вопрос: Как получить листья для данного node_id?

Структура таблицы:

CREATE TABLE `DATA_TREE` (
  `ID` int(11) NOT NULL,
  `PARENT_ID` int(11) NOT NULL,
  `DATA` varchar(45) DEFAULT NULL,
  PRIMARY KEY (`ID`),
  UNIQUE KEY `ID_UNIQUE` (`ID`),
  KEY `fk_DATA_TREE_1_idx` (`PARENT_ID`),
  CONSTRAINT `fk_DATA_TREE_1` FOREIGN KEY (`PARENT_ID`) REFERENCES `DATA_TREE` (`ID`) ON DELETE NO ACTION ON UPDATE NO ACTION
) ENGINE=InnoDB DEFAULT CHARSET=utf

База данных: MySQL 5.1.61

1 ответ

Решение

Нет способа сделать это в одном запросе. Даже если бы это было, это было бы очень неэффективно.

Мы можем сделать это с помощью хранимой процедуры и цикла. С добавленными вами индексами это тоже должно быть довольно быстро. При этом используются две таблицы, выбирающие узлы из входной таблицы (A) и вставляющие узел и их дочерние элементы в (B). Затем он меняет B на A и повторяется до тех пор, пока в A. не останется больше неконечных узлов. Приятно то, что итераций цикла будет только столько, сколько их уровней между входным узлом и последним листовым узлом, что в большинстве случаев вероятно, не так глубоко. Эта хранимая процедура будет быстрее, чем внешне в коде.

К вашему сведению, у меня были проблемы с установкой, обрабатывающей временные таблицы, если вы получите сообщение об ошибке 2, удалите временное ключевое слово.

delimiter $$
drop procedure if exists GetLeafNodes $$
create procedure GetLeafNodes(nodeid int)
begin
declare N int default 1;

-- create two working sets of IDs, we'll go back and forth between these two sets
drop temporary table if exists A;
drop temporary table if exists B;
create temporary table A(node int, child int);
create temporary table B(node int, child int);

-- insert our single input node into the working set
insert into A values (null, nodeid);

while (N>0) do
  -- keep selecting child nodes for each node we are now tracking
  -- leaf nodes will end up with the child set to null
  insert into B
  select ifnull(A.child,A.node), tree.ID
    from A
    left outer join DATA_TREE as tree on A.child=tree.parent_id;

  -- now swap A and B
  rename table A to temp, B to A, temp to B;

  -- remove non-leaf nodes from table B
  delete from B;

  -- exit when there are no longer any non-leaf nodes in A
  set N=(select count(*) from A where child is not null);
end while;

-- now output our list of leaf nodes
select node from A;

drop temporary table A;
drop temporary table B;
end $$
DELIMITER ;
call GetLeafNodes(4);

Я использовал следующий набор образцов для тестирования:

CREATE TABLE `DATA_TREE` (
  `ID` int(11) NOT NULL,
  `PARENT_ID` int(11) NOT NULL,
  PRIMARY KEY (`ID`),
  UNIQUE KEY `ID_UNIQUE` (`ID`),
  KEY `fk_DATA_TREE_1_idx` (`PARENT_ID`)
) ENGINE=InnoDB
;

insert into DATA_TREE values
(1,0),(2,1),(3,1),(4,1),(5,3),(6,3),(7,4),(8,4),(9,4),(10,6),(11,6),(12,7),(13,9),(14,9),(15,12),(16,12),(17,12),(18,14);
Другие вопросы по тегам