码迷,mamicode.com
首页 > 其他好文 > 详细

Hive Group By 常见错误

时间:2018-07-26 14:58:54      阅读:209      评论:0      收藏:0      [点我收藏+]

标签:总结   去重   mys   ESS   key   post   ble   sql   html   

Expression not in GROUP BY key ‘ xxx’

遇到这么一个需求,输入数据为一个ID对应多个name,要求输出数据为ID是唯一的,name随便取一个就可以。

执行以下hive ql语句:

会报错:

查了一下,HIVE有这么一个函数collect_set,类似于mysql的group_concat函数,把每个分组的其他字段,按照逗号进行拼接,得到一个最终字符串:

将上述的QL语句改一下:

结果是这样的:

这个时候,我们就可以针对第二列做一些计数、求和操作,分别对应到Hive的聚合函数count、sum。

对应到本文的目的,直接从数组获取第一个元素就达到目的了,这样做:

结果如下:

总结:

  1. Hive不允许直接访问非group by字段;
  2. 对于非group by字段,可以用Hive的collect_set函数收集这些字段,返回一个数组;
  3. 使用数字下标,可以直接访问数组中的元素;

参考文章:http://wangjunle23.blog.163.com/blog/static/117838171201310222309391/

本文地址:http://www.crazyant.net/1600.html

Hive Group By 常见错误

标签:总结   去重   mys   ESS   key   post   ble   sql   html   

原文地址:https://www.cnblogs.com/Allen-rg/p/9371100.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!