标签:
1. 查询语句可以加上一句:
-- 定义job名字SET mapred.job.name=‘customer_rfm_analysis_L1‘;
这样在job任务列表里可以第一眼找到自己的任务。
2. 少用distinct, 因为会把数据弄在一个reduce中,造成数据倾斜。
尽量用group by,distinct数据数量大于1000条时。
3.
Hue 简单使用笔记
原文地址:http://www.cnblogs.com/skyEva/p/5201638.html