天天看点

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

在关系型数据库中设计树形的数据结构一直是一个十分考验开发者能力的,最常用的方案有主从表方案和继承关系(parent_id)方案。主从表方案的最大缺点是树形结构的深度扩展困难,一般来说都是固定的,适合深度固定的需求。继承关系方案设计和实现自然而然,非常直观和方便。缺点当然也是非常的突出:由于直接地记录了节点之间的继承关系,因此对Tree的任何 CRUD操作都将是低效的,这主要归根于频繁的“递归”操作,递归过程不断地访问数据库,每次数据库IO都会有时间开销。因此这种方案适合Tree规模相对较小的情况,我们可以借助于缓存机制来做优化,将Tree的信息载入内存进行处理,避免直接对数据库IO操作的性能开销。

理想中树形结构应该具备如下特征:检索遍历过程简单高效;节点增删改查CRUD操作高效;数据存储冗余度小、直观性强。笔者在查阅网上相关资料之后整理了一个基于左右值编码的树形结构的数据库表结构设计方案,并在MySQL数据库中实现。

首先我们记住以下这张图

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图一 左右值属性结构

采用深度优先遍历给树中的每个节点分配两个值,一个左值和一个右值。节点左边的值比该节点的所有子孙节点值都要小,节点右边的值比该节点的所有子孙节点值都要大。例如:

B左边的值为2,其比Hell Mayes的所有子孙节点的值都要小(D[3,4]、E[5,10]、I[6,7]、J[8,9]、F[11,12])

B右边的值为13,其比Hell Mayes的所有子孙节点的值都要大(D[3,4]、E[5,10]、I[6,7]、J[8,9]、F[11,12])

有了这个规则整棵树的结构通过左值和右值存储了下来。

接下来我们在MySQL中建表,并实现整棵树的CURD方法

创建表结构
CREATE 
           
插入数据
INSERT INTO `tree` VALUES
(1,'A',1,20),
(2,'B',2,13),
(3,'C',14,19),
(4,'D',3,4),
(5,'E',5,10),
(6,'F',11,12),
(7,'G',15,16),
(8,'H',17,18),
(9,'I',6,7),
(10,'J',8,9);
           

准备工作就绪。

1)获取某个节点的子孙节点

以B为例:

SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 13 ORDER BY Lft ASC
           
把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图二 B的子孙节点

某个节点到底有多少的子孙节点呢?通过该节点的左、右值我们可以将其子孙节点圈进来,则子孙总数 = (右值 – 左值– 1) / 2,以B为例,其子孙总数为:(13–2 – 1) / 2 = 5。同时,为了更为直观地展现树形结构,我们需要知道节点在树中所处的层次,通过左、右值的SQL查询即可实现。以B为例:

SELECT COUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=13
           

结果为2,表明B处于该树的第二层。为了方便描述,我们可以为Tree建立一个视图,添加一个层次字段,该字段值可以写一个自定义函数来计算,函数定义如下:

定义计算指定节点所在层的函数CountLayer
CREATE DEFINER=`root`@`localhost` FUNCTION `CountLayer`(p_node_id int) RETURNS int(11)
BEGIN
declare p_result,p_lft,p_rgt int default 0;
if exists (select 1 from tree where node_id=p_node_id) then
begin
select lft, rgt into p_lft, p_rgt from tree where node_id=p_node_id;
select count(*) into p_result from tree where lft <= p_lft and rgt >= p_rgt;
end;
return p_result;
end if;
RETURN 0;
END
           

函数名称为CountLayer,需传入指定节点的id。此时我们可以基于刚刚定义的层计算函数来创建一个包含层次字段的试图。

定义层次试图Tree_View

CREATE
ALGORITHM = UNDEFINED
DEFINER = `root`@`localhost`
SQL SECURITY DEFINER
VIEW `tree_view` AS
SELECT
`tree`.`node_id` AS `node_id`,
`tree`.`name` AS `name`,
`tree`.`lft` AS `lft`,
`tree`.`rgt` AS `rgt`,
COUNTLAYER(`tree`.`node_id`) AS `layer`
FROM
`tree`
ORDER BY `tree`.`lft`
           
把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图三 各节点所处的层次

此时我们来创建一个存储过程,用来获取给定节点的所有子孙节点和每个节点所在的层。

获取所有子孙节点的存储过程GetChildrenNodeList
CREATE DEFINER=`root`@`localhost` PROCEDURE `GetChildrenNodeList`(in p_node_id int)
BEGIN
declare p_lft,p_rgt int default 0;
if exists (select node_id from tree where node_id=p_node_id) then
begin
select lft,rgt into p_lft,p_rgt from tree where node_id=p_node_id;
select * from Tree_View where lft between p_lft and p_rgt order by layer, lft;
end;
end if;
END
           

查询B的所有子孙节点

call GetChildrenNodeList(2);
           

可以得到

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图四 B的所有子孙节点及相应的层

可以计算其子孙节点,当让也可以计算其节点。

创建获取所有父节点的存储过程GetParentNodePath
CREATE DEFINER=`root`@`localhost` PROCEDURE `GetParentNodePath`(in p_node_id int)
BEGIN
declare p_lft,p_rgt int default 0;
if exists (select node_id from tree where node_id=p_node_id) then
begin
select lft,rgt into p_lft,p_rgt from tree where node_id=p_node_id;
select * from Tree_View where lft<p_lft and rgt>p_rgt order by layer,lft asc;
end;
end if;
END
           

以E节点为例:

call GetParentNodePath(5);
           

可以得到

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图五 E的所有父节点

2)在某个节点下插入一个子节点。

仔细观察图一,我们以在H下添加一个节点K为例。K节点的左值为H节点的右值,K节点的右值为其左值+1,其他所有右值大于等于K的左值的节点的右值须+2,所有左值大于等于K的左值的节点的左值须+2。图示如下:

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图六 新增节点

我们将其定义为存储过程:

添加节点的存储过程AddSubNode
CREATE DEFINER=`root`@`localhost` PROCEDURE `AddSubNode`(in p_node_id int,in p_node_name varchar(50))
BEGIN
declare p_rgt int default 0;
if exists(select node_id from tree where node_id=p_node_id) then
begin
SET AUTOCOMMIT=0;
START TRANSACTION;
select rgt into p_rgt from tree where node_id=p_node_id;
update tree set rgt=rgt+2 where rgt>=p_rgt;
update tree set lft=lft+2 where lft>=p_rgt;
insert into tree(name,lft,rgt) values(p_node_name,p_rgt,p_rgt+1);
COMMIT;
end;
end if;
END
           

调用AddSubNode存储过程

call AddSubNode(8,'K');
           
把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图七 K节点成功插入

3)删除节点

删除节点是新增节点的逆向过程。

创建删除节点存储过程DelNode
CREATE DEFINER=`root`@`localhost` PROCEDURE `DelNode`(in p_node_id int)
BEGIN
declare p_lft,p_rgt int default 0;
if exists(select p_node_id from tree where node_id =p_node_id) then
START TRANSACTION;
select lft,rgt into p_lft,p_rgt from tree where node_id=p_node_id;
delete from tree where lft>=p_lft and rgt<=p_rgt;
update tree set lft=lft-(p_rgt - p_lft + 1) where lft > p_lft;
update tree set rgt=rgt-(p_rgt - p_lft + 1) where rgt > p_rgt;
COMMIT;
end if;
END
           

以删除C节点为例

call DelNode(3);
           

再次查询tree结果为:

把数据转换为在内存中Tree(树形结构)。_[MySQL]基于左右值编码的树形数据库表结构设计...

图八 C及其所有的子节点都被删除

到此我们已将基于左右值编码的树形数据库表结构设计的基本原理介绍完了。当然,对于节点的操作还远不止这些,感兴趣的朋友可以自己动手实现。

诚然,这个方案也有其不足之处:节点的添加、删除及修改代价较大,将会涉及到表中多方面数据的改动。但是,在消除了递归操作的前提下实现了无限分组,而且查询条件是基于整形数字的比较,效率很高。所以,该方案比较实用与查询较多,变更不大的场景。

不足之处,躬请指正。

继续阅读