大数据量下的数据库日期操作问题

发表于:2007-06-20来源:作者:点击数: 标签:
说明:以下 数据库 操作基于 SQL Server 2000 问题出现: 假设一个新闻系统,你需要获取最近一周的热点文章,一定会使用类似下面的SQL语句: select top 50 newsID, newsTitle, newsRead from newstable where datediff(d, newsTime, getdate())7 order by n

   

说明:以下数据库操作基于SQL Server 2000

问题出现:
假设一个新闻系统,你需要获取最近一周的热点文章,一定会使用类似下面的SQL语句:

select top 50 newsID, newsTitle, newsRead from newstable where datediff("d", newsTime, getdate())<7 order by newsRead desc
只要对newsID,newsRead,newsTime都有索引,用查询分析器分析成本发现成本非常小,在newstable数据量小的情况下,访问速度非常快。可是最近发现,当newstable到达200万条记录的时候,这条看似简单的语句执行居然要1分钟以上。

 

解决问题:
这个问题排查比较简单,去掉order by一样很慢,只能断定是datediff造成的。我们尝试把上面的语句分成2段:

第一条语句:select min(newsID) from newstable where datediff("d", newsTime, getdate())<7
第二条语句:select top 50 newsID, newsTitle, newsRead from newstable where newsID>[minID] order by newsRead desc
其中[minID]是第一条语句的结果,我们发现:第二条语句执行非常快,关键是第一条慢。newsID和newsTime均有索引,这是为什么呢?

 

换一个思路,第一条语句基本等价为

第三条语句:select max(newsID) from newstable where datediff("d", newsTime, getdate())>=7
奇怪了,第三条语句执行起来飞快,虽然问题是曲线解决了,可这又是为什么?难道和索引的排序次序有关?欢迎大家讨论。

 

原文转自:http://www.ltesting.net