码迷,mamicode.com
首页 > 其他好文 > 详细

Hive 使用问题记录(未完...)

时间:2016-12-29 22:56:31      阅读:165      评论:0      收藏:0      [点我收藏+]

标签:元素   使用   class   分区   ...   style   time   blog   sdn   

group by 中出现的字段不能再select 后面单独显示,必须配合函数使用

select count(a.id)   
from (select id,collect_set(time) as t from t_action_login where time<=20150906 group by id) as a where size(a.t)=1 and a.t[0]=20150906;  

上面中的

select id,collect_set(time) as t from t_action_login where time<=20150906 group by id  

总结:

    1. Hive不允许直接访问非group by字段;
    2. 对于非group by字段,可以用Hive的collect_set函数收集这些字段,返回一个数组;
    3. 使用数字下标,可以直接访问数组中的元素;

 

分区是以文件夹的形式,桶是以文件的形式

关于桶的操作 http://blog.csdn.net/lzm1340458776/article/details/43272379

Hive 使用问题记录(未完...)

标签:元素   使用   class   分区   ...   style   time   blog   sdn   

原文地址:http://www.cnblogs.com/qiaoyihang/p/6209591.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!