标签:
至于两个表都进行分区,其好处是可以使用parallel query,就是多个进程同时对不同的分区进行join,然后再合并。但是复杂。
1.散列连接是CBO做大数据集连接时的常用方式.
2.也可以用USE_HASH(table_name1 table_name2)提示来强制使用散列连接
3.Hash join在两个表的数据量差别很大的时候.
4.Hash join的工作方式是将一个表(通常是小一点的那个表)做hash运算,将列数据存储到hash列表中,从另一个表中抽取记录,做hash运算,到hash列表中找到相应的值,做匹配。
当缺乏索引或者索引条件模糊时,哈希连接连接比嵌套循环有效。通常比排序合并SORT MERGE JOIN连接快。
在数据仓库环境下,如果表的纪录数多,效率高。
标签:
原文地址:http://www.cnblogs.com/zxtceq/p/5691213.html