天天看点

PLSQL_性能优化系列15_Oracle Explain Plan解析计划解读

2014-12-19 Created By BaoXinjian

一、摘要

在SQL语句的执行计划中,包含很多字段项和很多模块,其不同字段代表了不同的含义且在不同的情形下某些字段、模块显示或不显示,下

面的描述给出了执行计划中各字段的含义以及各模块的描述。

二、执行计划分析过程

1. 分析解析计划

Step1. 打开熟悉的查看工具:PL/SQL Developer - Toad。

在PL/SQL Developer中写好一段SQL代码后,按F5,PL/SQL Developer会自动打开执行计划窗口,显示该SQL的执行计划。

Step2. 查看总COST,获得资源耗费的总体印象

 一般而言,执行计划第一行所对应的COST(即成本耗费)值,反应了运行这段SQL的总体估计成本,单看这个总成本没有实际意义,

但可以拿它与相同逻辑不 同执行计划的SQL的总体COST进行比较,通常COST低的执行计划要好一些。  

Step3. 按照从左至右,从上至下的方法,了解执行计划的执行步骤

执行计划按照层次逐步缩进,从左至右看,缩进最多的那一步,最先执行,如果缩进量相同,则按照从上而下的方法判断执行顺序,可粗略认为上面的步骤优先执行。

每一个执行步骤都有对应的COST,可从单步COST的高低,以及单步的估计结果集(对应ROWS/基数),来分析表的访问方式,连接顺序以及连接方式是 否合理。

Step4. 分析表的访问方式

表的访问方式主要是两种:

全表扫描(TABLE ACCESS FULL)和索引扫描(INDEX SCAN),如果表上存在选择性很好的索引,却走了全表扫描,而且是大表的全表扫描,就说明表的访问方式可能存在问题;

若大表上没有合适的索引而走了全表 扫描,就需要分析能否建立索引,或者是否能选择更合适的表连接方式和连接顺序以提高效率。

Step5. 分析表的连接方式和连接顺序

表的连接顺序:就是以哪张表作为驱动表来连接其他表的先后访问顺序。

表的连接方式:简单来讲,就是两个表获得满足条件的数据时的连接过程。

主要有三种表连接方式,嵌套循环(NESTED LOOPS)、哈希连接(HASH JOIN)和排序-合并连接(SORT MERGE JOIN)。我们常见得是嵌套循环和哈希连接。

嵌套循环:

最适用也是最简单的连接方式。类似于用两层循环处理两个游标,外层游标称作驱动表,Oracle检索驱动表的数据,一条一条的代入内层游标,查找满足WHERE条件的所有数据,因此内层游标表中可用索引的选择性越好,嵌套循环连接的性能就越高。

哈希连接:

先将驱动表的数据按照条件字段以散列的方式放入内存,然后在内存中匹配满足条件的行。

哈希连接需要有合适的内存,而且必须在CBO优化模式下,连接两表的WHERE条件有等号的情况下才可以使用。哈希连接在表的数据量较大,表中没有合适的索引可用时比嵌套循环的效率要高。

2. 总结两点:

2.1 这里看到的执行计划,只是SQL运行前可能的执行方式,实际运行时可能因为软硬件环境的不同,而有所改变,而且cost高的执行计划,不一定在实际运行起来,速度就一定差,我们平时需要结合执行计划,和实际测试的运行时间,来确定一个执行计划的好坏。

2.2 对于表的连接顺序,多数情况下使用的是嵌套循环,尤其是在索引可用性好的情况下,使用嵌套循环式最好的,但当ORACLE发现需要访问的数据表较大,索引 的成本较高或者没有合适的索引可用时,会考虑使用哈希连接,以提高效率。排序合并连接的性能最差,但在存在排序需求,或者存在非等值连接无法使用哈希连接 的情况下,排序合并的效率,也可能比哈希连接或嵌套循环要好。

三、执行计划中各字段的描述

1. 基本字段(总是可用的)

Id            执行计划中每一个操作(行)的标识符。如果数字前面带有星号,意味着将在随后提供这行包含的谓词信息

Operation  对应执行的操作。也叫行源操作

Name        操作的对象名称

2. 查询优化器评估信息

Rows(E-Rows)     预估操作返回的记录条数

Bytes(E-Bytes)    预估操作返回的记录字节数

TempSpc            预估操作使用临时表空间的大小

Cost(%CPU)        预估操作所需的开销。在括号中列出了CPU开销的百分比。注意这些值是通过执行计划计算出来的。换句话说,父操作的开销包含子操作的开销

Time                  预估执行操作所需要的时间(HH:MM:SS)

3. 分区(仅当访问分区表时下列字段可见)

Pstart   访问的第一个分区。如果解析时不知道是哪个分区就设为KEY,KEY(I),KEY(MC),KEY(OR),KEY(SQ)

Pstop    访问的最后一个分区。如果解析时不知道是哪个分区就设为KEY,KEY(I),KEY(MC),KEY(OR),KEY(SQ)

4. 并行和分布式处理(仅当使用并行或分布式操作时下列字段可见)

Inst         在分布式操作中,指操作使用的数据库链接的名字

TQ          在并行操作中,用于从属线程间通信的表队列

IN-OUT    并行或分布式操作间的关系

PQ Distrib 在并行操作中,生产者为发送数据给消费者进行的分配

5. 运行时统计(当设定参数statistics_level为all或使用gather_plan_statistics提示时,下列字段可见)

Starts       指定操作执行的次数

A-Rows     操作返回的真实记录数

A-Time     操作执行的真实时间(HH:MM:SS.FF)

6. I/O 统计(当设定参数statistics_level为all或使用gather_plan_statistics提示时,下列字段可见)

Buffers     执行期间进行的逻辑读操作数量

Reads      执行期间进行的物理读操作数量

Writes      执行期间进行的物理写操作数量         

7. 内存使用统计

OMem        最优执行所需内存的预估值

1Mem        一次通过(one-pass)执行所需内存的预估值

0/1/M        最优/一次通过/多次通过(multipass)模式操作执行的次数

Used-Mem  最后一次执行时操作使用的内存量

Used-Tmp  最后一次执行时操作使用的临时空间大小。这个字段必须扩大1024倍才能和其他衡量内存的字段一致(比如,32k意味着32MB)

Max-Tmp   操作使用的最大临时空间大小。这个字段必须扩大1024倍才能和其他衡量内存的字段一致(比如,32k意味着32MB)

四、执行计划中各模块的描述与举例

1. 执行前,系统预估解析计划,Explain Plan

2. 执行后,系统实际解析计划,Explain Plan

Thank and Regards

转载:乐沙弥 - http://blog.csdn.net/leshami/article/details/6860007

<b>ERP技术讨论群: 288307890</b>

<b>技术交流,技术讨论,欢迎加入</b>

<b>Technology Blog Created By Oracle ERP - 鲍新建</b>