ORACLE数据库的统计数据及其生成方式

发表于:2007-07-13来源:作者:点击数: 标签:
ORACLE 数据库的PL/SQL 语句执行的优化器,有基于代价的优化器(CBO)和基于规则的优化器(RBO)。RBO 的优化方式,依赖于一套严格的语法规则,只要按照规则写出的语句,不管数据表和索引的内容是否发生变化,不会影响 PL/SQL 语句的 " 执行计划 " 。CBO 自

ORACLE 数据库的PL/SQL 语句执行的优化器,有基于代价的优化器(CBO)和基于规则的优化器(RBO)。RBO 的优化方式,依赖于一套严格的语法规则,只要按照规则写出的语句,不管数据表和索引的内容是否发生变化,不会影响 PL/SQL 语句的 " 执行计划 " 。CBO 自 ORACLE 7 版被引入, ORACLE 自 7 版以来采用的许多新技术都是只基于 CBO 的,如星型连接排列查询,哈希连接查询,反向索引,索引表,分区表和并行查询等。CBO 计算各种可能 " 执行计划 " 的 " 代价 " ,即 cost ,从中选用 cost 最低的方案,作为实际运行方案。各 " 执行计划 " 的 cost 的计算根据,依赖于数据表中数据的统计分布, ORACLE 数据库本身对该统计分布是不清楚的,须要分析表和相关的索引,才能搜集到 CBO 所需的数据。CBO 是 ORACLE 推荐使用的优化方式,要想使用好 CBO ,使 SQL 语句发挥最大效能,必须保证统计数据的及时性。统计信息的生成可以有完全计算法和抽样估算法。

SQL 例句如下:

完全计算法: analyze table abc compute statistics;

抽样估算法 ( 抽样 20%) : analyze table abc estimate statistics sample 20 percent;

对表作完全计算所花的时间相当于做全表扫描,抽样估算法由于采用抽样,比完全计算法的生成统计速度要快,如果不是要求要有精确数据的话,尽量采用抽样分析法。建议对表分析采用抽样估算,对索引分析可以采用完全计算。

我们可以采用以下两种方法,对数据库的表和索引及簇表定期分析生成统计信息,保证应用的正常性能

1. 在系统设置定时任务,执行分析脚本。

在数据库服务器端,我们以 UNIX 用户 oracle ,运行脚本 analyze, 在 analyze 中,我们生成待执行 sql 脚本,并运行。(假设我们要分析 scott 用户下的所有表和索引) Analyze 脚本内容如下:

clearcase/" target="_blank" >cccccc border=1>


sqlplus scott/tiger << EOF

set pagesize 5000

set heading off

SPOOL ANALYTAB.SQL

SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE 
STATISTICS SAMPLE 20 PERCENT ;' FROM USER_TABLES ;

SPOOL OFF

SPOOL ANALYIND.SQL

SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE 
STATISTICS SAMPLE 20 PERCENT FOR ALL INDEXES;' FROM USER_TABLES ;

SPOOL OFF

SPOOL ANALYZE.LOG

@ANALYTAB.SQL

@ANALYIND.SQL

SPOOL OFF

EXIT

在 UNIX 平台上 crontab 加入,以上文件,设置为每个月或合适的时间段运行。

2. 利用 ORACLE 提供的程序包( PACKAGE )对相关的数据库对象进行分析。

有以下的程序包可以对表,索引,簇表进行分析。

包中的存储过程的相关参数解释如下:

TYPE 可以是: TABLE , INDEX , CLUSTER 中其一。

SCHEMA 为: TABLE , INDEX , CLUSTER 的所有者, NULL 为当前用户。

NAME 为:相关对象的名称。

METHOD 是: ESTIMATE , COMPUTE , DELETE 中其一,当选用 ESTIMATE ,

下面两项, ESTIMATE_ROWS 和 ESTIMATE_PERCENT 不能同时为空值。

ESTIMATE_ROWS 是:估算的抽样行数。

ESTIMATE_PERCENT 是:估算的抽样百分比。

METHOD_OPT 是:有以下选项,

FOR TABLE /* 只统计表 */

[FOR ALL [INDEXED] COLUMNS] [SIZE N] /* 只统计有索引的表列 */

FOR ALL INDEXES /* 只分析统计相关索引 */

PARTNAME 是:指定要分析的分区名称。

1)



DBMS_DDL.ANALYZE_OBJECT(

TYPE VARCHAR2,

SCHEMA VARCHAR2,

NAME VARCHAR2,

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL,

PARTNAME VARCHAR2 DEFAULT NULL ) ;

该存储过程可对特定的表,索引和簇表进行分析。

例如,对 SCOTT 用户的 EMP 表,进行 50% 的抽样分析,参数如下:

DBMS_DDL.ANALYZE_OBJECT('TABLE', 'SCOTT', 'EMP', 'ESTIMATE', NULL,50);

2)





DBMS_UTILITY.ANALYZE_SCHEMA (

SCHEMA VARCHAR2,

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL ) ;

DBMS_UTILITY.ANALYZE_DATABASE (

METHOD VARCHAR2,

ESTIMATE_ROWS NUMBER DEFAULT NULL,

ESTIMATE_PERCENT NUMBER DEFAULT NULL,

METHOD_OPT VARCHAR2 DEFAULT NULL ) ;

其中, ANALYZE_SCHEMA 用于对某个用户拥有的所有 TABLE , INDEX 和 CLUSTER 的分析统计。

ANALYZE_DATABASE 用于对整个数据库进行分析统计。

3) DBMS_STATS 是在 ORACLE8I 中新增的程序包,它使统计数据的生成和处理更加灵活方便,并且可以并行方式生成统计数据。在程序包中的以下过程分别分析统计 TABLE , INDEX , SCHEMA , DATABASE 级别的信息。

DBMS_STATS.GATHER_TABLE_STATS

DBMS_STATS.GATHER_INDEX_STATS

DBMS_STATS.GATHER_SCHEMA_STATS

DBMS_STATS.GATHER_DATABASE_STATS

在这里,我们以数据库 JOB 的方式,定时对数据库中 SCOTT 模式下所有的表和索引进行分析:

在 SQL*PLUS 下运行:

VARIABLE jobno number;

BEGIN

DBMS_JOBS.SUBMIT ( :jobno ,

' dbms_utility.analyze_schema ( "scott", "estimate", NULL, 20) ; ',

sysdate, 'sysdate+30');

commit;

end;

/

Statement processed.

Print jobno

JOBNO

-------------

16


以上作业,每隔一个月用 DBMS_UTILITY.ANALYZE_SCHEMA 对用户SCOTT 的所有表,簇表和索引作统计分析。

  

原文转自:http://www.ltesting.net