Oracle 执行顺序 及 驱动表和被驱动表

oracle驱动表以及如何确定驱动表 

驱动表普遍认为是由SQL语句的写法决定的,简单的说,就是FROM语句后面的表列表中的最后一个。由于SQL语句是从后向前进行分析,Oracle会根据FROM语句从后到前将各个表依次连接起来。


首先理解执行顺序

先从最开头一直往右看,直到看到最右边的并列的地方,对于不并列的,靠右的先执行:对于并列的,靠上的先执行。
 即并列的缩进,从上往下执行,非并列的缩进块,从下往上执行。

1.    如果所连接的表ABA表长度远远大于B表,建议从较大的A表上驱动。(简言之 大值为驱动表)

2.  如果Where子句中含有选择性条件,Where No=20,将最具有选择性部分放在表达式最后。

3.  如果只有一个表有索引,另一表无索引,无索引的表通常作为驱动表。

A表的No列以被索引,而B表的No列没被索引,

则应当B表作为驱动表,A表作为被驱动表。

RBO或者CBO没有分析table的情况下,对于2个表的操作,FROM子句中,RBO选择最右的表作为驱动表(一般也就是from 中最后的表作为驱动表 ) 

所以 对于NESTED LOOPSHASH JOINSORT MERGE JOIN方式,驱动表选择较小的表 (放在from 最右端),速度会更快;  

存在主、外键关系的表,由于主键由oracle自动建立索引,外键上最好也建索引,以避免全表扫描  

而对于3个或以上table接查询,对于FROM子句,RBO以从右到左的顺序处理表连接,也就是from 子句最右端table作为驱动表。


SQL>CREATE TABLE T1 AS SELECT * FROM USER_TABLES;

表已创建。

SQL>CREATE TABLE T2 AS SELECT * FROM USER_INDEXES;

表已创建。

SQL>SET AUTOT ON EXP
SQL> SELECT COUNT(*) FROM T1,
T2 WHERE T1.TABLE_NAME = T2.TABLE_NAME;

COUNT(*)
----------
37

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT ptimizer=CHOOSE
1 0 SORT (AGGREGATE)
2 1 MERGE JOIN
3 2 SORT (JOIN)
4 3 TABLE ACCESS (FULL) OF ‘T2‘
5 2 SORT (JOIN)
6 5 TABLE ACCESS (FULL) OF ‘T1‘


T2 是驱动表


SQL> SELECT COUNT(*) FROM T2, T1 WHERE T1.TABLE_NAME = T2.TABLE_NAME;

COUNT(*)
----------
37

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT ptimizer=CHOOSE
1 0 SORT (AGGREGATE)
2 1 MERGE JOIN
3 2 SORT (JOIN)
4 3 TABLE ACCESS (FULL) OF ‘T1‘
5 2 SORT (JOIN)
6 5 TABLE ACCESS (FULL) OF ‘T2‘


根据这个例子,可以看出,SQL语句的写法对于驱动表的影响。

然而,实际上驱动表和连接顺序的选择要比上面的观点复杂的多,下面对稍微调整一下这个例子。

T1 是驱动表

SQL> ALTER TABLE T1 ADD CONSTRAINT PK_T1 PRIMARY KEY (TABLE_NAME);

表已更改。

SQL> SELECT COUNT(*) FROM T1, T2 WHERE T1.TABLE_NAME = T2.TABLE_NAME;

COUNT(*)
----------
37

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT ptimizer=CHOOSE
1 0 SORT (AGGREGATE)
2 1 NESTED LOOPS
3 2 TABLE ACCESS (FULL) OF ‘T2‘
4 2 INDEX (UNIQUE SCAN) OF ‘PK_T1‘ (UNIQUE)

SQL> SELECT COUNT(*) FROM T2, T1 WHERE T1.TABLE_NAME = T2.TABLE_NAME;

COUNT(*)
----------
37

Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT ptimizer=CHOOSE
1 0 SORT (AGGREGATE)
2 1 NESTED LOOPS
3 2 TABLE ACCESS (FULL) OF ‘T2‘
4 2 INDEX (UNIQUE SCAN) OF ‘PK_T1‘ (UNIQUE)


仅仅是给T1增加了一个主键,就发现不管SQL语句怎么写驱动表都是T2

即使是RBO,确定表连接顺序的规则也是比较复杂的:


1.优化器产生一系列连接顺序,每次均把不同的表作为驱动表。而且,优化器根据下面的算法产生每个连接顺序。

为了确定连接顺序中各个表的位置,优化器根据RBO执行计划的排名,在剩余的表中找到表访问路径排名最高的表,然后不断的重复这个过程,依次确定连接顺序中每个表的前后顺序。

对于连接顺序中的每张表,优化器根据执行计划的排名选择一种连接方式将当前表和前面的表或数据源连接在一起。

2.优化器在执行计划的结果集中进行选择。

优化器的目标是最大程度的选择内部表采用索引扫描方式的 NESTED LOOPS 连接操作。

通常情况下,优化器在选择执行计划时,不会考虑表在FROM语句中出现的顺序。

优化器依次根据下面的规则来作出选择:

优化器选择执行计划使得内部表为全表扫描的NESTED LOOPS连接尽可能的少;

如果采用上面的条件出现了平局的情况,则优化器选择尽可能少出现SORT MERGE操作的执行计划;

如果仍然出现平局的情况,则优化器将选择表访问路径中排名最高的表作为驱动表;

如果这时仍然是平局,则优化器会把 FROM 语句中最后出现的表最为驱动表





郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。