你知道如何优化Join语句吗？

时间：2019-11-12 00:24:03 阅读：183 评论：0 收藏：0 [点我收藏+]

标签：性能优化 iter 驱动 ora prim value strong wro bcg

join语句的两种算法，分别是：NLJ和BNL

测试数据：

create table t1(id int primary key, a int, b int, index(a));
create table t2 like t1;
drop procedure idata;
delimiter ;;
create procedure idata()
begin
  declare i int;
  set i=1;
  while(i<=1000)do
    insert into t1 values(i, 1001-i, i);
    set i=i+1;
  end while;
  
  set i=1;
  while(i<=1000000)do
    insert into t2 values(i, i, i);
    set i=i+1;
  end while;

end;;
delimiter ;
call idata();

Multi-Range Read优化

MRR的设计思路就是：大多数数据都是按照主键递增的顺序插入得到的，所以我们可以认为，如果按照主键的递增顺序查询的话，多磁盘的读比较接近于顺序读，能够提升读的性能。

此时，执行语句将会变成这样：

根据索引a，定位满足条件的记录，将id值放入read_rnd_buffer中;
将read_rnd_buffer中的id进行递增排序
排序后的id数组，依次到主键 id索引中查找记录，并作为结果返回。

如果我们想稳定低使用MRR优化的话，需要设置set optimizer_switch="mrr_cost_based =off"参数

总结一下：MRR的核心就是，这条查询语句在索引a上做的是一个范围查询（多值查询），可以得到足够多的主键id，这样通过排序后，再去主键索引差数据，才能体现出“顺序性”

Batched key Access优化

MySQL在5.6版本后，引入了BKA算法，其实就是对NLJ算法的优化

NLJ的逻辑是，从驱动表t1，逐行取出a的值，再到驱动表t2去做join。

我们可以把表t1 的数据取出来一部分，先放到一个临时内存中，这个临时内存就是join_buffer

启动BKA算法的参数是：

set optimizer_switch=‘mrr=on,mrr_cost_based=off,batched_key_access=on‘;

BNL性能优化

在通常情况下，我们可以直接在被驱动表上建立索引，这样就可以将BNL算法成NLJ算法了。但是有一些被驱动表不适合做索引，例如：

select * from t1 join t2 on (t1.b=t2.b) where t2.b>=1 and t2.b<=2000;

这句SQL表示，在经过where条件过滤，需要参与join的只有2000行数据。如果这条数据是一个低频的SQL，那么在为表t2建立一个字段b的索引，就很浪费了。

但是如果我们使用BNL算法，那么我们首先会将表t1存入join_buffer，然后扫描表t2与join_buffer中的数据进行比对，这里的数据是指所有的数据。这个判断等值条件的次数是1000*100万=10亿次。

这个时候，我们可以考虑使用临时表来优化，大致的思路是：

把表中t2满足条件的数据，先放在临时表tmp_t中；
为了让join可以使用BKA算法，给临时表tmp_t的字段加上索引
让临时表和t1做join操作

create temporary table temp_t(id int primary key, a int, b int, index(b))engine=innodb;
insert into temp_t select * from t2 where b>=1 and b<=2000;
select * from t1 join temp_t on (t1.b=temp_t.b);