Генерация дерева на основе глубины из иерархических данных в MySQL (без CTE)
Привет В течение многих дней я работал над этой проблемой в MySQL, однако я не могу понять это. У кого-нибудь из вас есть предложения?
По сути, у меня есть таблица категорий с доменами, такими как: id
, name
(название категории) и parent
(идентификатор родителя категории).
Пример данных:
1 Fruit 0
2 Apple 1
3 pear 1
4 FujiApple 2
5 AusApple 2
6 SydneyAPPLE 5
....
Есть много уровней, возможно, более 3 уровней. Я хочу создать SQL-запрос, который группирует данные в соответствии с иерархией: родитель> ребенок> внук> и т. Д.
Он должен вывести древовидную структуру следующим образом:
1 Fruit 0
^ 2 Apple 1
^ 4 FujiApple 2
- 5 AusApple 2
^ 6 SydneyApple 5
- 3 pear 1
Могу ли я сделать это с помощью одного запроса SQL? Альтернатива, которую я попробовал и работает, заключается в следующем:
SELECT * FROM category WHERE parent=0
После этого я снова перебираю данные и выбираю строки, где parent = id. Это кажется плохим решением. Поскольку это MySQL, CTE не могут быть использованы.
4 ответа
Вы можете сделать это за один вызов из php в mysql, если вы используете хранимую процедуру:
Пример звонков
mysql> call category_hier(1);
+--------+---------------+---------------+----------------------+-------+
| cat_id | category_name | parent_cat_id | parent_category_name | depth |
+--------+---------------+---------------+----------------------+-------+
| 1 | Location | NULL | NULL | 0 |
| 3 | USA | 1 | Location | 1 |
| 4 | Illinois | 3 | USA | 2 |
| 5 | Chicago | 3 | USA | 2 |
+--------+---------------+---------------+----------------------+-------+
4 rows in set (0.00 sec)
$sql = sprintf("call category_hier(%d)", $id);
Надеюсь это поможет:)
Полный сценарий
Структура тестовой таблицы:
drop table if exists categories;
create table categories
(
cat_id smallint unsigned not null auto_increment primary key,
name varchar(255) not null,
parent_cat_id smallint unsigned null,
key (parent_cat_id)
)
engine = innodb;
Тестовые данные:
insert into categories (name, parent_cat_id) values
('Location',null),
('USA',1),
('Illinois',2),
('Chicago',2),
('Color',null),
('Black',3),
('Red',3);
Процедура:
drop procedure if exists category_hier;
delimiter #
create procedure category_hier
(
in p_cat_id smallint unsigned
)
begin
declare v_done tinyint unsigned default 0;
declare v_depth smallint unsigned default 0;
create temporary table hier(
parent_cat_id smallint unsigned,
cat_id smallint unsigned,
depth smallint unsigned default 0
)engine = memory;
insert into hier select parent_cat_id, cat_id, v_depth from categories where cat_id = p_cat_id;
/* http://dev.mysql.com/doc/refman/5.0/en/temporary-table-problems.html */
create temporary table tmp engine=memory select * from hier;
while not v_done do
if exists( select 1 from categories p inner join hier on p.parent_cat_id = hier.cat_id and hier.depth = v_depth) then
insert into hier
select p.parent_cat_id, p.cat_id, v_depth + 1 from categories p
inner join tmp on p.parent_cat_id = tmp.cat_id and tmp.depth = v_depth;
set v_depth = v_depth + 1;
truncate table tmp;
insert into tmp select * from hier where depth = v_depth;
else
set v_done = 1;
end if;
end while;
select
p.cat_id,
p.name as category_name,
b.cat_id as parent_cat_id,
b.name as parent_category_name,
hier.depth
from
hier
inner join categories p on hier.cat_id = p.cat_id
left outer join categories b on hier.parent_cat_id = b.cat_id
order by
hier.depth, hier.cat_id;
drop temporary table if exists hier;
drop temporary table if exists tmp;
end #
Тестовые прогоны:
delimiter ;
call category_hier(1);
call category_hier(2);
Некоторое тестирование производительности с использованием геопланет Yahoo размещает данные
drop table if exists geoplanet_places;
create table geoplanet_places
(
woe_id int unsigned not null,
iso_code varchar(3) not null,
name varchar(255) not null,
lang varchar(8) not null,
place_type varchar(32) not null,
parent_woe_id int unsigned not null,
primary key (woe_id),
key (parent_woe_id)
)
engine=innodb;
mysql> select count(*) from geoplanet_places;
+----------+
| count(*) |
+----------+
| 5653967 |
+----------+
так что в таблице 5,6 миллиона строк (мест), давайте посмотрим, как обрабатывает реализация списка смежностей / хранимая процедура, вызываемая из php.
1 records fetched with max depth 0 in 0.001921 secs
250 records fetched with max depth 1 in 0.004883 secs
515 records fetched with max depth 1 in 0.006552 secs
822 records fetched with max depth 1 in 0.009568 secs
918 records fetched with max depth 1 in 0.009689 secs
1346 records fetched with max depth 1 in 0.040453 secs
5901 records fetched with max depth 2 in 0.219246 secs
6817 records fetched with max depth 1 in 0.152841 secs
8621 records fetched with max depth 3 in 0.096665 secs
18098 records fetched with max depth 3 in 0.580223 secs
238007 records fetched with max depth 4 in 2.003213 secs
В целом, я очень доволен этими холодными средами выполнения, поскольку я даже не стал бы задумываться о возврате десятков тысяч строк данных в мой интерфейс, а скорее построил бы дерево, динамически выбирая только несколько уровней за вызов. Да, и только в том случае, если вы думаете, что innodb медленнее myisam - протестированная мной реализация myisam была вдвое медленнее во всех отношениях.
Больше вещей здесь: http://pastie.org/1672733
Надеюсь это поможет:)
Существует два распространенных способа хранения иерархических данных в СУБД: списки смежности (которые вы используете) и вложенные множества. Об этих альтернативах очень хорошо написано в разделе "Управление иерархическими данными в MySQL". Вы можете делать только то, что хотите, в одном запросе с моделью вложенного набора. Тем не менее, модель с вложенным набором делает более трудной работу по обновлению иерархической структуры, поэтому вам необходимо учитывать компромиссы в зависимости от ваших операционных требований.
Вы не можете достичь этого с помощью одного запроса. Ваша иерархическая модель данных в этом случае неэффективна. Я предлагаю вам попробовать два других способа хранения иерархических данных в базе данных: модель MPTT или модель "lineage". Использование любой из этих моделей позволяет сделать выбор за один раз.
Вот статья с дополнительной информацией: http://articles.sitepoint.com/article/hierarchical-data-database
Линейный путь:
Я использую некрасивую функцию для создания дерева в простом строковом поле.
/ topic title
/001 message 1
/002 message 2
/002/001 reply to message 2
/002/001/001/ reply to reply
/003 message 3
etc...
таблицу можно использовать для выбора всех строк в древовидном порядке с помощью простого SQL-запроса:
select * from morum_messages where m_topic=1234 order by m_linear asc
INSERT
просто выберите родительский линейный (и дочерние) и вычислите строку при необходимости.
select M_LINEAR FROM forum_messages WHERE m_topic = 1234 and M_LINEAR LIKE '{0}/___' ORDER BY M_LINEAR DESC limit 0,1
/* {0} - m_linear of the parent message*/
DELETE
это просто, как удалить сообщение, или удалить линейно все ответы родительского.