标签:loading 数据库 star 用户id alt 用户数 lazy 通过 并保存
网站用户行为分析
1.1 本地数据集上传到数据仓库Hive
1.2 Hive数据分析
1.3 Hive、MySQL、HBase数据互导
2.1 数据准备
第一步,通过samba服务共享文件
第二步,数据下载预处理
第三步,将数据上传至hdfs
第四步,在hive上创建数据库和表
第五步,查看创建表的数据类型与信息
2.2 Hive数据分析
(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录
分析步骤
(2)用户行为分析需求:分析每月1-31号购买情况
语句:create table day_uid as select count(distinct uid),day(visit_date) from bigdata_user where behavior_type=‘4‘ group by day(visit_date);
按省份统计购买数量
用户10001082在2014-12-12号当天活跃度:该用户点击行为占该天所有点击行为的比例
(3)自定义需求:
12月10号买了超过四种商品的用户id
语句:select uid from bigdata_user where behavior_type=‘4‘ and visit_date=‘2014-12-10‘ group by uid having count(behavior_type=‘4‘)>5;
10号,购买,3项以上
语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-10‘ group by uid having count(*)>3 limit 10;
通国际当天购买商品钟类为3的天数,并保存到表中
语句:create table day_count_3 as select count(*),day(visit_date) from bigdata_user where behavior_type=‘3‘ group by day(visit_date);
标签:loading 数据库 star 用户id alt 用户数 lazy 通过 并保存
原文地址:https://www.cnblogs.com/Margerita/p/14193457.html