使用Explain进行查询及应用优化_数据库

使用Explain进行查询及应用优化

发表于：2007-05-25来源：作者：点击数：标签：优化 Explain 应用查询进行

应用的优化不仅需要知道应用作了什么，还必须知道应用是如何工作的以及使用何种数据库设计来支持，必须了解使用哪种类型的SQL语句，语句中表与视图的结构及与这些表相关的各类索引。另外，优化整个应用系统可能并不是必需的，了解应用的各个部分可以让我们

　　应用的优化不仅需要知道应用作了什么，还必须知道应用是如何工作的以及使用何种数据库设计来支持，必须了解使用哪种类型的SQL语句，语句中表与视图的结构及与这些表相关的各类索引。另外，优化整个应用系统可能并不是必需的，了解应用的各个部分可以让我们了解哪些部分是需要优化的。我们将主要讨论使用Oracle RDBMS提供的性能优化工具进行SQL级的优化。
　　
　　Explain可以用来迅速方便地查出对于给定SQL语句中的查询数据是如何得到的即搜索路径(我们通常称为Aclearcase/" target="_blank" >ccess Path)。Access Path对性能会有非常大的影响。我们将会讨论各种Access Path和使用的优缺点。
　　
　　使用Explain
　　使用Explain工具需要创建Explain_plan表，这必须先进入相关应用表、视图和索引的所有者的帐户内。Oracle的介质中包含有执行此项工作的SQL源程序，例如：
　　
　　ORA_RDBMS: XPLAINPL.SQL (VMS)
　　
　　$ORACLE_HOME/rdbms/admin/utlxplan.sql (UNIX)
　　
　　这个SQL程序应与catalog.sql在同一目录，这个程序会创建一个名为plan_table的表，表结构如下：
　　
　　Name Type
　　
　　STATEMEN_ID VARCHAR2(30)
　　
　　TIMESTAMP DATE
　　
　　REMARKS VARCHAR2(80)
　　
　　OPERATION VARCHAR2(30)
　　
　　OPTIONS VARCHAR2(30)
　　
　　Object_node VARCHAR2(128)
　　
　　Object_owner VARCHAR2(30)
　　
　　Object_name VARCHAR2(30)
　　
　　Object_instance NUMBER(38)
　　
　　Object_type VARCHAR2(30)
　　
　　Search_columns NUMBER(38)
　　
　　ID NUMBER(38)
　　
　　PARENT_ID NUMBER(38)
　　
　　POSITION NUMBER(38)
　　
　　OTHER LONG
　　这里介绍一些我们将会讨论的column的主要概念。如果需要每一个column的详细介绍，请看explain.doc文件。
　　
　　STATEMENT_ID：为一条指定的SQL语句确定特定的执行计划名称。如果在EXPLAN PLAN语句中没有使用SET STATEMENT_ID，那么此值会被设为NULL。
　　
　　OPERATION：在计划的某一步骤执行的操作名称，例如：Filters，Index，Table，Marge Joins and Table等。
　　
　　OPTION：对OPERATION操作的补充，例如：对一个表的操作，OPERATION可能是TABLE ACCESS，但OPTION可能为by ROWID或FULL。
　　
　　Object_Owner：拥有此database Object的Schema名或Oracle帐户名。
　　
　　Object_name：Database Object名
　　
　　Object_type：类型，例如：表、视图、索引等等
　　
　　ID：指明某一步骤在执行计划中的位置。
　　
　　PARENT_ID：指明从某一操作中取得信息的前一个操作。通过对与ID和PARENT_ID使用Connect By操作，我们可以查询整个执行计划树。
　　
　　这个PLAN表一旦创建成功，用户就可在应用中使用EXPLAIN。使用语法如下：
　　
　　EXPLAIN PLAN [ SET STATEMENT_ID [=] < string literal > ]
　　
　　[ INTO < table_name > ]
　　
　　FOR < sql_statement >
　　
　　其中：
　　STATEMENT_ID是一个唯一的字符串，把当前执行计划与存储在同一PLAN表中的其它执行计划区别开来。
　　
　　TABLE_NAME是plan表名，它结构如前所示，你可以任意设定这个名称。
　　
　　SQL_STATEMENT是真正的SQL语句。
　　
　　例如：
　　
　　EXPLAIN PLAN
　　
　　SET STATEMENT_ID=‘QUERY1’
　　
　　FOR
　　
　　SELECT
　　
　　FROM EMP
　　
　　WHERE DEPTNO=10;
　　
　　执行后将会得到以下信息：
　　
　　operation 50 succeeded
　　
　　注意，如果在Explain语句中忽略INTO句，则EXPLAIN会使用PLAN_TABLE作为表名，我们可以用查询plan table的方法来检查执行计划，如：
　　
　　SELECT OPERATION, OPTIONS, OBJECT_NAME, OBJECT_TYPE, ID, PARENT_ID
　　
　　FROM PLAN_TABLE
　　
　　WHERE STATEMENT_ID=‘QUERY1’
　　
　　ORDER BY ID;
　　
　　将会返回如下：
　　
　　OPERATION OPTION Object_name Object_type ID Parent_ID
　　
　　TABLE ACCESS FULL EMP TABLE 1 1
　　
　　1 row selected
　　
　　这意味在这个查询中将会使用全表扫描，如果在EMP表上没有创建索引，对EMP的所有查询都将使用全表扫描，但是如果在DEPTNO列上创建一个非唯一的索引：
　　
　　CREATE INDEX EMP_IDX ON EMP(DEPTNO);
　　
　　现在，如果我们重新解释查询：
　　
　　EXPLAIN PLAN
　　
　　SET STATEMENT_ID＝’QUERY2’
　　
　　FOR
　　
　　SELECT *
　　
　　FROM EMP
　　
　　WHERE DEPTNO=10;
　　
　　然后检查计划表：
　　
　　SELECT OPERATION， OPTIONS， OBJECT_NAME，OBJECT_TYPE，ID，PARENT_ID
　　
　　FROM PLAN_TABLE
　　
　　WHERE STATEMENT_ID=‘QUERY2’
　　
　　ORDER BY IB;
　　
　　将返回：
　　
　　OPERATION OPTION Object_name Object_type ID Parent_ID
　　
　　TABLE ACCESS BY RAWID EMP TABLE 1
　　
　　INDEX RANGE SCAN EMP_IDX NON_UNIQUE 2 1
　　
　　2 row selected
　　
　　这样，我们可以看到索引EMP_IDX被用于得到所有DEPTNO等于10的行，然后根据ROWID取得数据，索引存储了表中每行的ROWID，每当在索引中找到一行，就会根据ROWID去查询该行的其余部分。如果是对一个很大的表的操作，这样的搜索路径较前一种(全表扫描)会对减少磁盘 I / O 操作有明显的效果。但是，如果索引是“低选择性的”，那么一个全表扫描可能会更有效。
　　
　　考虑以下的查询及其执行计划：
　　
　　EXPLAIN PLAN
　　
　　SET STATEMENT_ID=‘QUERY3’
　　
　　FOR
　　
　　SELECT DEPTNO
　　
　　FROM EMP
　　
　　WHERE DEPTNO=10
　　
　　执行路径的计划是：
　　
　　OPERATION OPTION Object_name Object_type ID Parent_ID
　　
　　INDEX RANGE_SCAN EMP_IDX NON_UNIQUE 1
　　
　　以上的执行计划表示不需在table中取得数据，此查询只须使用索引。
　　
　　EXPLAIN搜索路径解释
　　任何SQL语句的执行计划都遵循一些优化原则，这些原则在Oracle数据库管理员手册中有详细介绍。同时，这些原则也被列在文本100040.163中。这些原则都试图在从数据库取出数据时找出一条最佳搜索路径。一旦优化器评估过查询并确定了搜索路径，优化器就会创建一个执行计划树。我们可以使用SQL*Plus查询plan table从而看到执行计划树：
　　
　　COLUMN plan FORMAT a70
　　
　　select lpad (‘ ‘, 3*level) || operation || (‘ || options ||’) ‘|| object_name || ‘ ‘ || object_type
　　
　　from plan_table
　　
　　connect by prior id=parent_id and statement_id=‘ & stmt_id’;
　　
　　例如下面这个查询
　　
　　SELECT ENAME
　　
　　FROM EMP
　　
　　WHERE DEPTNO=10
　　
　　ORDER BY ENAME;
　　
　　使用以上SQL语句检查plan table的结果是：
　　
　　SORT ( ORDER BY )
　　
　　TABLE ACCESS ( BY ROWID ) EMP
　　
　　INDEX ( RANGE SCAN ) EMP_IDX N0N_UNIQUE
　　
　　这个执行计划树表示在EMP_IDX索引上执行一个索引扫描，然后ENAME数据被按照ROWID从表中取了出来，最后这些数据被ORDER BY操作归类。如果EMP表大的话，那么这个执行计划树的最后一步可能花较长的时间。
　　
　　假设我们解释如下查询：
　　
　　select deptno, ename
　　
　　from emp
　　
　　where deptno between 1 and 30
　　
　　order by deptno;
　　
　　那么执行树为：
　　
　　TABLE ACCESS ( BY ROWID) EMP
　　
　　INDEX (RANGE SCAN) EMP_IDX NON_UNIQUE
　　
　　请注意，虽然在查询时使用了order by，但在执行树中并未出现SORT (ORDER BY)。为什么呢？不使用SORT有二个原因：1) deptno列上已经建立了index，已作过sort；2)deptno被定义为not null(如：DEPTNO NOT NULL NUMBER)。
　　
　　假设下面这个普通的连接查询：
　　
　　SELECT *
　　
　　from emp. dept
　　
　　where emp.deptno=dept.deptno
　　
　　and sal >5000;
　　
　　执行树为：
　　
　　NESTED LOOPS ()
　　
　　TABLE ACCESS (FULL)DEPT
　　
　　TABLE ACCESS (BY ROWID)EMP
　　
　　INDEX (RANGE SCAN) EMP_IDX NON_UNIQUE
　　
　　NESTED LOOPS意味着在一个表(DEPT)上作了一个序列查询，同时在EMP表上的索引EMP_IDX中，每一个DEPTNO均作查找。这个查询被称为一个驱动表( driving table )。在这种情况下，驱动表是DEPT。在这种类型的连接中，驱动表是被列在后面的表。因为两个表有相同级别的搜索路径 (都在deptno列上有非唯一的索引) ，既然至少有一个表上的所有记录必须被检索，那么在一个表上执行全表扫描，同时在另一个表的索引上寻找符合条件的记录是比较有效的。
　　
　　这种情况下，我们应把具有最少列的表作为驱动表放在from子句的最后，注意，在这种类型的连接中，from子句中表的先后次序决定了RDBMS的搜索路径。如果where条件是有一个是返回一个单记录的话，那么以上查询中的驱动表应使用连接查询。假设在EMP表的EMPNO列上有一个唯一索引，那么以下SQL语句：
　　
　　SELECT *
　　
　　from EMP, DEPT
　　
　　WHERE EMP.DEPTNO=DEPT.DEPTNO
　　
　　AND EMPNO=7735;
　　
　　的执行树是：
　　
　　NESTED LOOPS ( )
　　
　　TABLE ACCESS (BY ROWID) EMP
　　
　　INDEX (UNIQUE SCAN) EMP_UIDX UNIQUE
　　
　　TABLE ACCESS (BY ROWID)DEPT
　　
　　INDEX (RANGE SCAN) DEPT_IDX NON_UNIQUE
　　
　　这个执行计划表示NESTED LOOPS只会执行一次，因为在驱动表EMP上执行了一个唯一索引检索。同时，在DEPT_IDX上进行索引检索。如果可以找到记录，那么可以根据ROWID取得这条记录。
　　
　　在Explain的输出中还可以看出其它的操作情况。例如查询中包括一个“connect by prior...”子句时，要使用connect by操作，RDBMS会根据连接条件在表上执行树遍历。我们刚才查询的执行计划树就是一个这样的例子。我们可以在这个查询中使用Explain并检查输出。
　　
　　我们还可以使用其它操作，例如FILTERS、PROJECT、UNION等。下面这个查询作一个FILTER操作：
　　
　　SELECT DEPTNO, AVG (SAL), SUM(COM)
　　
　　from emp
　　
　　Group by deptno
　　
　　having SUM(COMM)>500;
　　
　　执行计划如下：
　　
　　FILTERS ( )
　　
　　SORT (GROUP BY)
　　
　　TABLE ACCESS (FULL) EMP
　　
　　执行完sort操作后，FILTERS会找出所有COMM大于500的记录。
　　
　　PROJECT操作不太常见。当使用MINUS和UNIONS在所有的列上查询这些列的一个子集时才会用到。如果在SQL语句中使用了MINUS和UNION，那么在执行计划中我们也可以找到这两个操作。
　　
　　视图：
　　我们还可以用EXPLAIN解释虚拟表或视图。因为应用中也会使用到，所以这样作是很有用的。我们只需对检索视图的查询使用EXPLAIN，就可以找到视图的搜索路径。假设如下视图：
　　
　　create view EMP_VIEW AS
　　
　　SELECT *
　　
　　FROM EMP
　　
　　WHERE DEPTNO>20;
　　
　　如果只是从视图中查询，那么执行计划树如下：
　　
　　TABLE ACCESS (BY) ROWID EMP
　　
　　INDEX (RANGE SCAN) EMP_IDX NON_UNNIQUE
　　
　　如果把这个视图与DEPT连接：
　　
　　SELECT ENAME, LOC
　　
　　FROM EMP_VIEWS, DEPT;
　　
　　那么执行计划为：
　　
　　NESTED LOOPS ()
　　
　　TABLE ACCESS (FULL )DEPT
　　
　　TABLE ACCESS (BY ROWID) EMP
　　
　　INDEX (RANGE SCAN) EMP_IDX NON_UNIQUE
　　
　　这与我们曾经提到的例子相似，如果在执行计划中某一步的操作是“view’，这是另一个操作，用于完成它的上一级操作。在视图定义在二个或多个表连接的情况下，会用到VIEW操作，这是一种不同的情况。
　　
　　如果你需要在你的应用中使用视图，那么应该先确定这些视图会对你的性能有很大的益处。Oracle工程师经常发现在许多应用系统中，不正确的使用视图，这样对性能毫无益处。
　　
　　限制：
　　虽然任何SQL语句都可以用EXPLAIN解释，但对于没有查询的INSERT，UPDATE，DELETE操作来说，这个工具并没有太大的用处。没有子查询的INSERT操作不会创建执行计划，但没有WHERE子句或子查询的UPDATE和DELETE操作会创建执行计划，因为这些操作必须先找出所要的记录。
　　
　　另外，如果你在SQL语句中使用其它类型如sequence等，EXPLAIN也能揭示它的用法。
　　
　　EXPLAIN真正的唯一的限制是用户不能去解释其它用户的表，视图，索引或其它类型，用户必须是所有被解释事物的所有者，如果不是所有者而只有select权限，EXPLAIN会返回一个错误。
　　
　　总结：
　　优化应用不但需要了解整个数据库的结构，而且还必须对各种SQL语句的结构有相当的知识。你可以使用Explain这个工具来确认你使用的搜索路径是否是最快的一种。在优化应用时，SQL语句的优化应该是最先考虑的，然后再考虑数据库与操作系统的优化。
　　
原文转自：http://www.ltesting.net

相关文章

Oracle cluster使用场景分析

Oracle cluster使用场景分析

Mysql如何使用内存

在oracle中使用自增字段

MySQL使用为什么要分库分表

Oracle游标使用大全

周排行

月排行

下载

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

MBT基于模型的测试介绍资料

iso29119相关介绍性资料

HP QTP 10 中文版官方中文补丁

HP QTP 10 英文版下载地址

HP ALM 11 官方中文版下载地址

Quality Center 9.0中文版下载地

HttpWatch Basic Edition Version 7.

WIN2003+ORACLE11G+QC11(ALM11) 安装

WIN2003+SQL2005(SP3)+QC11(ALM11) 安

软件测试沙龙 More>>

新浪微博 More>>

热门标签

功能测试

性能测试

安全测试

本地化测试

游戏测试

web测试

单元测试

敏捷测试

测试用例

测试模版

测试管理

测试工具

《测试团队的招聘与管理

《我们应该如何构建我们

软件测试 > 测试开发技术 > 软件测试开发语言 > 数据库 >

使用Explain进行查询及应用优化