标签:有一个 第一个 data 拉取 tin keyword 答案 分配 受限
数据倾斜的原因很大部分是join倾斜和聚合倾斜两大类
select * from log a
join users b
on a.id is not null and a.id = b.id
union all
select * from log a
where a.id is null;
select * from log a
left outer join users b
on
case when a.user_id is null
then concat(‘hive’,rand() )
else a.user_id end = b.user_id;
对上文描述的总结
标签:有一个 第一个 data 拉取 tin keyword 答案 分配 受限
原文地址:https://www.cnblogs.com/sx66/p/12039563.html