第 10 章 优化策略与工具 10.1 标识问题 10.2 我的方法 10.3 绑定变量与分析(再次) 不使用绑定变量将增加语句分析,除了消耗CPU时间外,还会增加字典高速缓存上的闩锁。 显示会话等待的事件:V$SESSION_EVENT.具体事件名和含义可以参考Oracle Reference Manual的附录Oracle Wait Events. CURSOR_SHARING CURSOR_SHARING参数缺省为EXACT,若指定为FORCE,则优化器可能将语句中所有的常数转换为绑定变量,虽然减少了语句分析,但是也会带来如下副作用: 优化器可供利用的信息可能减少,从而改变执行路径,例如条件中对于某个特定值索引有较好的选择性,改为绑定变量时优化器并不会发现这一点。 查询输出格式发生变化。虽然返回的数据长度不变,但列的长度可能改变。例如对于SELECT id, ‘tom’ name from emp; name应该为VARCHAR2(3),但是由于‘tom’被改为绑定变量,则可能name的显示长度变为32. 查询计划更难评估。由于语句的改变,EXPLAIN PLAN看到的查询与数据库看到的可能不一致,从而使AUTOTRACE等的输出与实际执行路径不一致。 因此,完善的应用系统不应当依靠CURSOR_SHARING来提高效率,仅能作为权宜之计。 10.4 SQL_TRACE, TIMED_STATISTICS与TKPROF TIMED_STATISTICS并不会对系统产生过大负担,因此建议设置为TRUE. 启动跟踪 SQL_TRACE可在系统或会话级激活。激活后跟踪文件将产生至init.ora参数USER_DUMP_DEST(专用服务器)或 BACKGROUND_DUMP_DEST(MTS)指定的目录。而文件大小通过MAX_DUMP_FILE_SIZE控制,其设置有如下三种方法: 仅数值:以OS块为单位; 数值+K/M:指定文件绝对大小; UNLIMITED:无上限。 一般只需要设置50-100M就足够了。 激活SQL_TRACE的几种常用方式如下: ALTER SESSION SET SQL_TRACE=TRUE|FALSE; SYS.DBMS_SYSTEM.SET_SQL_TRACE_IN_SESSION 这里我们需要指定SID和SERIAL#(参考V$SESSION); ALTER SESSION SET EVENTS. 可获得更详细的信息。 此外也可通过DBMS_SUPPORT包,相当于EVENTS跟踪的一个界面,但此包需要Oracle人员支持,非标配。 随着WEB服务方式的普及,往往一个数据库会话很短,难以单独跟踪,对此,我们可以根据用户,在数据库级建立触发器: CREATE OR REPLACE TRIGGER logon_trigger AFTER LOGON ON DATABASE BEGIN IF ( USER= ‘TKYTE’ ) THEN EXECUTE IMMEDIATE ‘ALTER SESSION SET EVENTS ‘ ’10046 TRACE NAME CONTEXT FOREVER, LEVEL 4’ ‘ ’; END IF; END;/ 1. 激活SQL_TRACE后,通过如下查询检查SPID: SELECT a.spid FROM v$process a, v$session b WHERE a.addr = b.paddr AND b.audsid = userenv(‘sessionid’); 此SPID就包含在跟踪文件的文件名中。 UNIX系统中,若你不在Oracle的管理组中,则生成的跟踪文件所在目录可能无法访问,此时需要设定init.ora参数_trace_files_public = true . 2. TKPROF语法: TKPROF *.trc *.txt 其他用法可以直接运行TKPROF查看。一般常用选项就是-sort,可以根据某些参数值排序。 3. 对跟踪文件输出的一些解释: i. 行: PARSE阶段:包括了软分析(在SHARED_POOL中找到语句)和硬分析; EXECUTE阶段:对SELECT几乎为空,对UPDATE则几乎是全部工作的体现; FETCH阶段:对SELECT是几乎所有的工作,对UPDATE则为空。 ii. 列: COUNT:事件发生的次数; CPU:消耗的CPU时间(CPU秒); ELAPSED:总体运行时间; DISK:磁盘物理I/O; QUERY:一致读模式访问的块数,也包括了从回滚段读取的块数; CURRENT:访问的当前信息数据块(而不是一致读模式),例如SELECT时读取数据字典内容,修改时也需要访问数据字典内容以写。 ROWS:所涉及的行数。 4. 需要注意的现象: i. 高的PARSE COUNT/EXECUTE COUNT(接近100%),且EXECUTE COUNT大于1 即执行语句时分析的次数,如果过高,可能是软分析也过多了,对一个会话,应该是分析一次反复执行。 ii. 对几乎所有SQL,EXECUTE COUNT都是1 可能没有使用绑定变量。在一个真实应用中,应该很少看到不同的SQL,同一个SQL应执行多次。 iii. CPU和ELAPSED时间相差较大 说明花了很长时间等待一个事件,例如磁盘I/O、锁等。 iv. (FETCH COUNT)/(ROWS FETCHED)比例高 没有很好的使用批量提取。批量提取数据的方法是和语言/API相关的,例如Pro* C中需要使用prefetch=NN预编译,Java/JDBC下可以调用SETROWPREFETCH方法,PL/SQL可以在SELECT INTO中直接使用BULK COLLECT.而SQL* PLUS缺省为每次取15行。 v. 极大的DISK COUNT 较难推断,但若DISK COUNT = QUERY + CURRENT MODE BLOCK COUNT,则说明几乎所有数据都来自磁盘。此时需要考虑SGA大小和此查询效率。 vi. 极大的QUERY COUNT或CURRENT COUNT SQL工作量很大,需要注意。 5. EXPLAIN PLAN问题 跟踪文件中显示的是真正执行的路径。TKPROF也支持EXPLAIN=XXX/XXX选项,不建议使用,其输出是转换跟踪文件当时优化器选择的执行路径,并是利用数据库的EXPLAIN工具,与真实路径时不完全一致的。 使用与解析原始跟踪文件 1. EVENTS跟踪 ALTER SESSION SET EVENTS ‘10046 trace name context forever, level N’; N=1 同标准SQL_TRACE; N=4 增加获得绑定变量值; N=8 增加获得查询级的等待事件; N=12 增加获得绑定变量值和查询级的等待事件。 2. 原始跟踪文件分段解析 文件头含有时间、数据库版本、OS版本、实例名等。 APPNAME mod=‘%s’ mh=%lu act=‘%s’ ah=%lu mod 传入DBMS_APPLICATION_INFO的模块名 mh 模块哈希值 act 传入DBMS_APPLICATION_INFO的动作 ah 动作哈希值 Parsing in Cursor #%d dep=%d uid=%ld oct=%d lid=%ld tim=%ld hv=%ld ad=‘%s’ Cursor # 游标号。也可以用此值获知应用最大打开的游标数。 len 下面SQL语句的长度 dep SQL语句的递归(recursive)深度 uid 当前方案的用户ID.注意,这并不一定和后面的lid一致,因为可以用 alter session set current_schema来修改分析时的方案 oct Oracle命令类型(Oracle Command Type) lid 用于安全性检查访问权限的用户ID tim 定时器,1/100秒 ha SQL语句的哈希ID ad V$SQLAREA中此SQL语句的ADDR列 EXEC Cursor#:c=%d,e=%d,p=%d,cr=%d,mis=%d,r=%d,dep=%d,og=%d,tim=%d Cursor # 游标号 c CPU时间,1/100秒 e 流逝(Elapsed)时间,1/100秒 p 物理读 cr 一致(QUERY模式)读(逻辑I/O) cu 当前(Current)模式读(逻辑I/O) mis 字典缓存中的游标不命中数,说明由于过期已从共享池中清除或从未进入共享池等,而不得不分析此语句 r 处理的行数 dep SQL语句的递归深度 og 优化器目标:1=ALL ROWS 2=FIRST ROWS 3=RULE 4=CHOOSE tim 定时器 与EXEC段类似的还有(即取代“EXEC”): PARSE 分析一个语句 FETCH 从一个游标取出数据行 UNMAP 用于显示在不需要时从中间结果释放临时段 SORT UMAP 同UNMAP,指排序段 WAIT Cursor#: nam=‘%s’ ela=%d p1=%ul p2=%ul p3=%ul Cursor# 游标号 nam 等待事件名 ela 流逝时间,1/100秒 p1,p2,p3 等待事件特定的参数 以上为文件头与ALTER SESSION出现的跟踪信息。此后开始出现运行的SQL语句。 BIND段 cursor# 游标号 bind N 绑定位置,从0开始 dty 数据类型 mxl 绑定变量最大长度 mal 最大数组长度(当使用数组绑定或BULK操作时) scl 数值范围(scale) pre 精度(precision) oacflg 内部标记。若此值为奇数,则绑定变量可能为NULL(允许为NULL) oacfl2 内部标记续 size 缓冲区大小 offset 用于逐片(piecewise)绑定 bfp 绑定地址 bln 绑定缓冲区大小 avl 真实值长度 flag 内部标记 value 绑定值的字符串表示(如果可能,会是一个十六进制dump) 其中dty:SELECT text FROM ALL_VIEWS WHERE view_name = ‘USER_VIEWS’ 可看到一个将dty数值转换为字符串表示的函数。 此后我们可以看到WAIT段,即真正的等待事件。 对于ENQUEUE事件,实际就是锁。可用以下函数(传入参数为p1)判断类型: CREATE OR REPLACE FUNCTION enqueue_decode(l_p1 in number) return varchar2 AS l_str varchar2(25); BEGIN SELECT CHR(BITAND(l_p1, -16777216) / 16777215) || CHR(BITAND(l_p1, 16711680) / 65535) || ‘ ‘ || DECODE(BITAND(l_p1, 65535), 0, ‘No lock’, 1, ‘No lock’, 2, ‘Row-Share’, 3, ‘Row-Exclusive’, 4, ‘Share’, 5, ‘Share Row-Excl’, 6, ‘Exclusive’ ) INTO l_str FROM DUAL; RETURN l_str; END; XCTEND(事务边界)段记录了提交等: rlbk 回滚标记:0 提交 1 回滚 rd_only 只读标记:0 变化提交或回滚 1 事务只读 STAT段记录了运行时SQL真正的执行计划: cursor # 游标号 id 执行计划行号 cnt 查询计划中流经此步骤的行数 pid 此步骤的父ID pos 执行计划中的位置 obj 访问的对象的对象ID op 操作的文本描述 PARSE ERROR段 len SQL语句长度 dep SQL语句递归深度 uid 分析的方案 oct Oracle命令类型 lid 权限方案ID tim 定时器 err ORA错误代码 ERROR段 cursor # 游标数 err ORA错误代码 tim 定时器 10.5 DBMS_PROFILER 10.6 StatsPack 10.7 V$表 V$EVENT_NAME 说明事件名和p1、p2、p3三个参数。 V$FILESTAT和V$TEMPSTAT 说明系统I/O概况。 V$LOCK 说明系统锁的情况。但注意Oracle并不在外部保存行锁,此视图可以找到TM(DML Enqueue)锁,即说明产生了行锁。 V$MYSTAT 说明当前会话的统计信息。需要V_$STATNAME(不用V$STATNAME,只是V_$STATNAME的一个同义词)和V_$MYSTAT上的SELECT权限。 CREATE VIEW MY_STATS AS SELECT a.name, b.value FROM V$STATNAME a, V$MYSTAT b WHERE a.statistic# = b.statistic#; V$OPEN_CURSOR 记录所有会话打开的游标。由于Oracle也会缓存已关闭的游标,因此此视图中也会包含已关闭的游标信息。 V$PARAMETER 说明了所有的init.ora参数。 V$SESSION 记录数据库的每个会话。需要对V_$SESSION的SELECT权限。 V$SESSION_EVENT 说明会话的事件情况。 V$SESSION_LONGOPS 记录CBO认为执行时间超过6秒的命令及进展。 V$SESSION_WAIT 记录所有正在等待某事件的会话及已等待时间。 V$SESSTAT 类似V$MYSTAT,但显示所有会话。 V$SESS_IO 说明会话的I/O信息 V$SQL和V$SQLAREA 记录SQL信息。建议使用V$SQL,V$SQLAREA是从V$SQL合并而来的视图,代价较高,对已经繁忙的系统是一个负担。 V$STATNAME 说明了统计号到统计名的映射。 V$SYSSTAT 记录实例层面的统计信息。当数据库关闭时才清空,也是StatsPack很多数据的来源。 V$SYSTEM_EVENT 记录实例层面的等待事件信息。也是StatsPack很多数据的来源。
使用并解析TKPROF输出