软件测试开发技术之数据库优化设计方案

发布: 2009-9-11 10:55 | 作者: 不详 | 来源: 领测软件测试网 | 查看: 53次 | 进入软件测试论坛讨论

　② 非聚族索引(Nonclustered Index)：与聚族索引相比，占用空间大，而且效率低。选择策略是，被用于Where子句的列：包括范围查询、模糊查询(在没有聚族索引时)、主键或外键列、点(指针类)或小范围(返回的结果域小于整表数据的20%)查询;被用于连接Join*作的列、主键列(范围查询);被用于Order by和Group by子句的列;需要被覆盖的列。对只读表建多个非聚族索引有利。索引也有其弊端，一是创建索引要耗费时间，二是索引要占有大量磁盘空间，三是增加了维护代价(在修改带索引的数据列时索引会减缓修改速度)。那么，在哪种情况下不建索引呢?对于小表(数据小于5页)、小到中表(不直接访问单行数据或结果集不用排序)、单值域(返回值密集)、索引列值太长(大于20bitys)、容易变化的列、高度重复的列、Null值列，对没有被用于Where子语句和Join查询的列都不能建索引。另外，对主要用于数据录入的，尽可能少建索引。当然，也要防止建立无效索引，当Where语句中多于5个条件时，维护索引的开销大于索引的效益，这时，建立临时表存储有关数据更有效。

　　批量导入数据时的注意事项：在实际应用中，大批量的计算(如电信话单计费)用C语言程序做，这种基于主外键关系数据计算而得的批量数据(文本文件)，可利用系统的自身功能函数(如Sybase的BCP命令)快速批量导入，在导入数据库表时，可先删除相应库表的索引，这有利于加快导入速度，减少导入时间。在导入后再重建索引以便优化查询。

　　(4)锁：锁是并行处理的重要机制，能保持数据并发的一致性，即按事务进行处理;系统利用锁，保证数据完整性。因此，我们避免不了死锁，但在设计时可以充分考虑如何避免长事务，减少排它锁时间，减少在事务中与用户的交互，杜绝让用户控制事务的长短;要避免批量数据同时执行，尤其是耗时并用到相同的数据表。锁的征用：一个表同时只能有一个排它锁，一个用户用时，其它用户在等待。若用户数增加，则Server的性能下降，出现“假死”现象。如何避免死锁呢?从页级锁到行级锁，减少了锁征用;给小表增加无效记录，从页级锁到行级锁没有影响，若在同一页内竞争有影响，可选择合适的聚族索引把数据分配到不同的页面;创建冗余表;保持事务简短;同一批处理应该没有网络交互。

　　(5)查询优化规则：在访问数据库表的数据(Access Data)时，要尽可能避免排序(Sort)、连接(Join)和相关子查询*作。经验告诉我们，在优化查询时，必须做到：

　　① 尽可能少的行;

　　② 避免排序或为尽可能少的行排序，若要做大量数据排序，最好将相关数据放在临时表中*作;用简单的键(列)排序，如整型或短字符串排序;

　　③ 避免表内的相关子查询;

　　④ 避免在Where子句中使用复杂的表达式或非起始的子字符串、用长字符串连接;

　　⑤ 在Where子句中多使用“与”(And)连接，少使用“或”(Or)连接;

　　⑥ 利用临时数据库。在查询多表、有多个连接、查询复杂、数据要过滤时，可以建临时表(索引)以减少I/O。但缺点是增加了空间开销。

　　除非每个列都有索引支持，否则在有连接的查询时分别找出两个动态索引，放在工作表中重新排序。

　　3 基本表扩展设计

　　基于第三范式设计的库表虽然有其优越性(见本文第一部分)，然而在实际应用中有时不利于系统运行性能的优化：如需要部分数据时而要扫描整表，许多过程同时竞争同一数据，反复用相同行计算相同的结果，过程从多表获取数据时引发大量的连接*作，当数据来源于多表时的连接*作;这都消耗了磁盘I/O和CPU时间。

　　尤其在遇到下列情形时，我们要对基本表进行扩展设计：许多过程要频繁访问一个表、子集数据访问、重复计算和冗余数据，有时用户要求一些过程优先或低的响应时间。

　　如何避免这些不利因素呢?根据访问的频繁程度对相关表进行分割处理、存储冗余数据、存储衍生列、合并相关表处理，这些都是克服这些不利因素和优化系统运行的有效途径。