分拆统计字符串
发表于:2007-07-02来源:作者:点击数:
标签:
在数据库表tbl1中有一个字段Keywords,它是nvarchar类型,长度为1000,该字段的内容是所要分析的论文的关键字id keywords -----------------------------------------------------------1 kw1;kw2;kw32 kw2;kw33 kw3;kw1;kw4 问题1。对于在keywords字段中出
在数据库表tbl1中有一个字段Keywords,它是nvarchar类型,长度为1000,该字段的内容是所要分析的论文的关键字id keywords -----------------------------------------------------------1 kw1;kw2;kw32 kw2;kw33 kw3;kw1;kw4
问题1。对于在keywords字段中出现的所有关键字集合(上例中关键字集合为{kw1,kw2,kw3,kw4})中的任意一个关键字,要统计它出现的次数(也就是包含该关键字的纪录的条数),然后写到另一张表中。最后的效果就是keywords count-------------------------kw1 2kw2 2kw3 3kw4 1
问题2。在此基础上,要进行组合查询。也就是说在整个关键字集合中任意抽出两个关键字,统计它们在数据库表纪录中同时出现的次数。对于上题,最后效果要是:keywords count----------------------------------kw1;kw2 1kw1;kw3 2kw1;kw4 1kw2;kw3 2kw2;kw4 0kw3;kw4 1
--------------------------------------------------------------------------------------
--统计示例
--为统计处理专门做的序数表select top 1000 id=identity(int,1,1) into 序数表 from syscolumns a,syscolumns balter table 序数表 add constraint pk_id_序数表 primary key(id)go
--示例数据create table tbl1(id int,keywords nvarchar(1000))insert tbl1 select 1,@#kw1;kw2;kw3@#union all select 2,@#kw2;kw3@#union all select 3,@#kw3;kw1;kw4@#go
--第一种统计(计数)select keyword=substring(a.keywords,b.id,charindex(@#;@#,a.keywords+@#;@#,b.id)-b.id) ,[count]=count(distinct a.id)from tbl1 a,序数表 bwhere b.id<=len(a.keywords) and substring(@#;@#+a.keywords,b.id,1)=@#;@#group by substring(a.keywords,b.id,charindex(@#;@#,a.keywords+@#;@#,b.id)-b.id)go
--第二种统计(组合统计)select keyword=substring(a.keywords,b.id,charindex(@#;@#,a.keywords+@#;@#,b.id)-b.id) ,[count]=count(distinct a.id),a.idinto #tfrom tbl1 a,序数表 bwhere b.id<=len(a.keywords) and substring(@#;@#+a.keywords,b.id,1)=@#;@#group by substring(a.keywords,b.id,charindex(@#;@#,a.keywords+@#;@#,b.id)-b.id),a.id
select keyword=a.keyword+@#;@#+b.keyword,[count]=sum(case a.id when b.id then 1 else 0 end)from #t a,#t bwhere a.keyword<b.keywordgroup by a.keyword,b.keywordorder by keyword
drop table #tgo
--删除
测试环境drop table tbl1,序数表
/*--测试结果
--统计1keyword count ---------- --------kw1 2kw2 2kw3 3kw4 1
(所影响的行数为 4 行)
--统计2keyword count ----------------------- -----------kw1;kw2 1kw1;kw3 2kw1;kw4 1kw2;kw3 2kw2;kw4 0kw3;kw4 1
(所影响的行数为 6 行)--*/
原文转自:http://www.ltesting.net