关于三种JOIN的理解

发表于:2007-06-22来源:作者:点击数: 标签:
Nested loop join: 步骤:确定一个驱动表(outer table),另一个表为inner table,驱动表中的每一行与inner表中的相应记录JOIN。类似一个嵌套的循环。适用于驱动表的记录集比较小(10000)而且inner表需要有有效的访问方法(Index)。 需要注意的是:JOIN的顺

   
  Nested loop join:
  
  步骤:确定一个驱动表(outer table),另一个表为inner table,驱动表中的每一行与inner表中的相应记录JOIN。类似一个嵌套的循环。适用于驱动表的记录集比较小(<10000)而且inner表需要有有效的访问方法(Index)。

需要注意的是:JOIN的顺序很重要,驱动表的记录集一定要小,返回结果集的响应时间是最快的。
  
  cost = outer aclearcase/" target="_blank" >ccess cost + (inner access cost * outer cardinality)
  
  |  2 |  NESTED LOOPS        |       |   3 |  141 |   7 (15)|
  |  3 |  TABLE ACCESS FULL     | EMPLOYEES  |   3 |  60 |   4 (25)|
  |  4 |  TABLE ACCESS BY INDEX ROWID| JOBS     |  19 |  513 |   2 (50)|
  |  5 |   INDEX UNIQUE SCAN     | JOB_ID_PK  |   1 |    |      |
  
  EMPLOYEES为outer table, JOBS为inner table.
  
  Hash join
  
  步骤:将两个表中较小的一个在内存中构造一个HASH表(对JOIN KEY),扫描另一个表,同样对JOIN KEY进行HASH后探测是否可以JOIN。适用于记录集比较大的情况。需要注意的是:如果HASH表太大,无法一次构造在内存中,则分成若干个partition,写入磁盘的temporary segment,则会多一个写的代价,会降低效率。
  
  cost = (outer access cost * # of hash partitions) + inner access cost
  --------------------------------------------------------------------------
  | Id | Operation      | Name    | Rows | Bytes | Cost (%CPU)|
  --------------------------------------------------------------------------
  |  0 | SELECT STATEMENT   |       |  665 | 13300 |   8 (25)|
  |  1 | HASH JOIN      |       |  665 | 13300 |   8 (25)|
  |  2 |  TABLE ACCESS FULL | ORDERS    |  105 |  840 |   4 (25)|
  |  3 |  TABLE ACCESS FULL | ORDER_ITEMS |  665 | 7980 |   4 (25)|
  --------------------------------------------------------------------------
  
  ORDERS为HASH TABLE,ORDER_ITEMS扫描
  
  Sort merge join
  
  步骤:将两个表排序,然后将两个表合并。通常情况下,只有在以下情况发生时,才会使用此种JOIN方式:
  
  1.RBO模式
  
  2.不等价关联(>,<,>=,<=,<>)
  
  3.HASH_JOIN_ENABLED=false
  
  4.数据源已排序
  
  cost = (outer access cost * # of hash partitions) + inner access cost

原文转自:http://www.ltesting.net