使用多中值排序基数实现大型树状结构
发表于:2007-06-30来源:作者:点击数:
标签:
在“中值排序基数法实现树状结构”中,为了解决回复限制的问题,我们可以增加第二(三、四……)基数字段。 其实在一般的BBS中,使用一个基数已经足够,因为一个贴子的回复太多或深度太大的时候,无论你的树状结构做得多好,由于屏幕的限制(显示折行),显示总
在“中值排序基数法实现树状结构”中,为了解决回复限制的问题,我们可以增加第二(三、四……)基数字段。
其实在一般的BBS中,使用一个基数已经足够,因为一个贴子的回复太多或深度太大的时候,无论你的树状结构做得多好,由于屏幕的限制(显示折行),显示总会乱,因此不如象在《补充》一文中,达到一定深度或个数时,后面的贴子采用平行显示的方法,不过那部分已经不再是树状结构了。
原理:在贴子显示的order by子句中,如果排序基数相同,则根据第二基数排序,从而避免树状结构限制。
一、在BBS的内容表中再增加一个第二基数字段ordernumS,同第一基数一样,可为int或numeric,看需要定。
这样在表中增加了四个冗余字段,rootid——用于记录根id,deep——用于记录回复的深度(为0时表示根贴),ordernum——第一排序基数,ordernumS——第二排序基数
表forum与(只列与树状结构有关的字段):
id rootid deep ordernum ordernumS
其中id、rootid、deep均为int型(deep可为tinyint型),ordernum为int或float型,ordernumS(默认值为0)同ordernum。
例:(在此为了简单,使用一个小的起始排序基数,且为int型,以清楚观察什么时候第二排序基数起作用)。
(下面所说的排序均指按ordernum从小到大,ordernumS从小到大排序,即order by ordernum,ordernumS)
(下面所说的精度为后贴与前贴的ordernum的差,精度标记指的是这个差大于某个值这个条件,比如(后贴的ordernum-前贴的ordernum)>1)
id rootid deep ordernum ordernumS
1 0 0 0 0
2 1 1 8 0
_____________________________________
3 1 1 4 0 回复第1贴,第一基数取1、2贴的第一基数中值即(0+8)/2=4
排序后结果为:
id rootid deep ordernum ordernumS
1 0 0 0 0
3 1 1 4 0
2 1 1 8 0
_____________________________________
4 1 2 6 0 回复第3贴,第一基数取3、2的第一基数中值即(4+8)/2
排序后结果为:
id rootid deep ordernum ordernumS
1 0 0 0 0
3 1 1 4 0
4 1 2 6 0
2 1 1 8 0
_____________________________________
5 1 3 7 0 回复第4贴,第一基数取4、2的第一基数中值即(6+8)/2
排序后的结果为:
id rootid deep ordernum ordernumS
1 0 0 0 0
3 1 1 4 0
4 1 2 6 0
5 1 3 7 0
2 1 1 8 0
_____________________________________
6 1 3 6 8 回复第4贴,第一基数取4、5的第一基数中值即(6+7)/2,因是int型,被截成了6
此时精度标记(暂设为1)已经不满足(即5的第一基数与4的第一基数差不大于1,为1),此时在父贴的第二基数加上一起始值作为新贴的第二基数
排序后的结果为:
id rootid deep ordernum ordernumS
1 0 0 0 0
3 1 1 4 0
4 1 2 6 0
6 1 3 6 8
5 1 3 7 0
2 1 1 8 0
_____________________________________
7 1 3 6 4 回复第4贴,第一基数取4、6的第一基数中值即(6+6)/2=6
此时精度标记(暂设为1)已经不满足(即4的第一基数与6的第一基数差不大于1,为0),此时第二基数取6、4的第二基数中值(0+8)/2=4
排序后的结果为:
id rootid deep ordernum ordernumS
1 0 0 0 0
3 1 1 4 0
4 1 2 6 0
7 1 3 6 4
6 1 3 6 8
5 1 3 7 0
2 1 1 8 0
这样排序基数ordernum、ordernumS与回复深度deep一起就实现了如下的树状结构:
id
1
3
4
7
6
5
2
在这可以看到,第一基数ordernum与第二基数ordernumS以及深度deep实现了树状结构!
二、插入的实现(如何确定排序基数,下面所指贴子均为同一根下的子贴)
(一)根第一基数ordernum定为0
(二)所有贴子第二基数默认为0
(三)第一条回复贴子基数定为2的整数次幂(如65536=2^16,可取更大的数)
(四)回复树中最后一条贴子时,基数取最后一贴的基数ordernum再加上2的整数次幂(同上)
(五)当第一基数差大于精度标记时,第一基数取中值,忽略第二基数(为0)
(五)当第一基数差等于精度标记时,第一基数取回复贴的第一基数,第二基数取回复贴的第二基数加上基数起始值
(六)当第一基数差小于精度标记时,第一基数取回复贴的第一基数,第二基数取前后贴的第二基数中值
如果要使用parentid字段,则更新相关的parentid,这里不再讨论。
三、删除的实现
删除贴子(剪枝)时,当:
(一)要删除的是根贴时,将整个树删除即可
(二)要删除的是子枝时,只需按ordernum和ordernumS排序,找出从指定要删除的贴子开始的所有贴子(使用条件rootid=@rootid and (ordernum>@ordernum or ordernum=@ordernum and ordernumS>=@ordernumS)),从上到下逐个判断深度是不是增加,如果增加则予以删除。一旦发现深度等于或小于要删贴子(枝顶)的深度,则马上退出删除。
如上例子中,要删除4贴一个分枝,只需找出4后面的所有贴子,然后逐个往下判断,如果深度大小4贴的深度则删除,而一旦遇到深度等于或者小于4贴深度,则马上退出删除。结果是4、7、6、5满足条件,这就是我们要删除的子枝。
如果要增加parentid字段,则需判断共删除了多少个贴子,以例更新有关的parentid字段。
为了方便和提高速,使用操作API光标的存储过程来进行。
四、显示的实现
只需执行select * from forum order by rootid+id-sign(rootid)*id desc,ordernum,ordernumS,然后结合deep就可实现树状的显示。
五、具体实现方法(以存储过程为例)
加贴存储过程:(ordernum和ordernumS使用int型,设精度标记为1)
CREATE PROCEDURE [add] @keyid int,@message varchar(50) OUTPUT ———keyid为回复的贴子id号,如果是新贴则为0,@message为出错信息
AS
IF (@keyid=0)
INSERT INTO forum (rootid,deep,ordernum,ordernumS……) values(0,0,0,0……)
ELSE
BEGIN
DECLARE @rootid int,@id int,@deep int,@begnum int,@endnum intt,@begS int,endS int,@ordernum int,@ordernumS int
SELECT @rootid=0,@id=0,@deep=0,@begnum=0,@endnum=0,@ordernum=0,@ordernumS=0,@begS=0,@endS=0
SELECT @rootid=rootid,@id=id,@begnum=ordernum,@begs=begs,@deep=deep from forum where id=@keyid
IF (@id=0)
BEGIN
SELECT @message='要回复的贴子已经被删除!'
return
END
ELSE
BEGIN
IF (@rootid=0) SELECT @rootid=@id ——回复的是根贴,取其id为新加贴的rootid
#1 SELECT top 1 @endnum=ordernum,@endS=ordernumS where rootid=@rootid and id<>@id by ordernum,ordernumS ——取回复贴子后面的那条贴出来
if @endnum-@begnum>1
SELECT @ordernum=(@begnum+@endnum)/2,@ordernumS=0 ——精度大小精度标记(在取为1),忽略第二基数(定为0)
else
BEGIN
select case @endnum-begnum
case 1
select @ordernum=@begnum,@ordernumS=@begS+65536 ——在父贴的第二基数基础上加一起始值作为新贴第二基数,实际应用中可在此限制范围以防溢出
case 0
select @ordernum=@begnum,@ordernumS=(@begS+endS)/2 ——取第二基数中值作为新贴第二基数
case else ——小于0(即@begnum=0),表示#1句中没有找到后面一条贴子,即要回复的是树中的最后一条贴子
SELECT @ordernum=@begnum+65536,@ordernumS=0 ——实际应用中可限制@ordernum的范围,以免溢出
end select
END
INSERT into forum (rootid,deep,ordernum,orderS……) values(@rootid,@deep+1,@ordernum,@ordernumS……)
END
END
Select @message='成功'
return
剪枝存储过程:
CREATE PROCEDURE [del] @keyid int,@message varchar(50) OUTPUT ———keyid为要删除的贴子id号,如果是新贴则为0,@message为出错信息
AS
DECLARE @rootid int,@id int,@deep int,@deept int
SELECT @rootid=0,@id=0,@deep=0,@deept=0
SELECT @id=id,@rootid=rootid,@deept=deep from forum where id=@keyid
IF (@id=0)
BEGIN
SELECT @message='该贴子不存在!"
return
END
ELSE
BEGIN
if (@rootid=0) ——要删的是根贴
delete from forum where id=@id or rootid=@id
else ——剪子枝
BEGIN
DECLARE forum_cur CURSOR
FOR
SELECT deep FROM forum WHERE rootid=@rootid and (ordernum>@ordernum or ordernum=@ordernum and ordernumS>=@ordernumS) order by ordernum,ordernumS
OPEN forum_cur
FETCH FROM forum_cur INTO @deep
DELETE FROM forum where CURRENT OF forum_cur ——删除最顶枝
WHILE @@fetch_status=0
BEGIN
FETCH FROM forum_cur INTO @deep
IF (@deep<=@
tdeep) or @@fetch_status<>0 ——一旦发现深比枝顶的深相等或还要小或者游标到了尾部,则马上退出
BEGIN
select @message='成功删除子枝'
CLOSE forum_cur
DEALLOCATE forum_cur
return
END
DELETE FROM forum WHERE CURRENT OF forum_cur
END
END
CLOSE freelt_cur
DEALLOCATE forum_cur
END
END
显示(略)
过程看起来比使用单个排序基数复杂了不少,其实主要是判断何时给第二基数赋值的问题。
注意事项:基数起始值不能取类型的最大值,比如int的最大限制为2^31,则基数起始值要预留空间,否则最后的子贴是无法回复的!!(或者如果限制了ordernum的范围,虽然可以回复,但它是平行显示的)
使用了两个基数的时候,一个子贴的回复数最多了900左右(int类型,30*30),14400(使用numeric类型时——此时的精度标记得细加斟酌),理论是有限制都是不够的,但实际上并不需要这么多。
对于基数分布不均匀的问题是无法解决的,因为实际上回复客户回复哪条贴子是不可预测的。
使用2的幂作为基数,是很容易理解的——不易近起结果取近似值(除非达到了计算机的最大精度),另一个原因是计算机使用二进制进行运算,乘除2只是位移操作,速度要比其它数快得多(我是这么想的)。另一个个人的原因是因为我个算法是源于以前的思想:收敛数列与递归算法。
由于增加了算法复杂程度和冗余字段,如非必要,实非不必。
其实我是没有时间进行
测试的,如果由于考虑不周或者算法错误引起无法使用,还请多多指教。
欢迎访问我的个人主页http://swuse.yeah.net
原文转自:http://www.ltesting.net