标签:
电子商城如果对大数据应用好的话,可以在很大程度上提升业绩。以下就让我们看看,电子商城可以怎么玩销售数据
业务信息
首先,简单了解下电子商城,对于大多数电子商城,一般都有如下业务信息:
1:产品信息 产品大类、产品小类、产品
2:销售信息 订单号、产品、购买数量、购买时间
3:用户 用户名、手机号、收货地址(默认、常用等)=》可以解析出用户真实所在城市
现在我们来算几个简单的东西
1、PV
关于PV,我们按日对某项业务或者行为做统计,最终展现以下结果:
按日统计:计算出当日PV,默认展现最近30天pv
按周统计:计算当周PV,默认展现最近1年各周pv
按月统计:计算当月PV,默认展现最近一年各周pv
按年统计:计算当年PV,默认展现最近5年pv
总PV:历史总pv
当日各小时:当前1小时,默认展现当日每个小时pv
思路:按日、周、月、年可以使用批处理作业,算完历史之后,每日增量处理。写入关系数据库
当日个小时统计:使用实时作业处理,每10秒处理一次,处理结果写入mysql,前段展现时进行汇总。
2、UV
关于UV,我们按日对某项业务或者行为做统计,最终展现以下结果:
按日统计:计算出当日UV,默认展现最近30天UV
按周统计:计算当周UV,默认展现最近1年各周UV
按月统计:计算当月UV,默认展现最近一年各周UV
按年统计:计算当年UV,默认展现最近5年UV
总UV:历史总UV
当日各小时:当前1小时,默认展现当日每个小时UV
思路:按日、周、月、年、总pv,可以使用批处理作业,先按日对数据distinct,之后,然后,对数据按日期(转换为相应的日、周、月、年、null)后进行count distinct,最后,将结果写入mysql
当日个小时统计:使用实时作业处理,每10秒对数据distinct一次,写入hdfs,后边跟一个批作业,每小时对数据做一次聚合得到结果,写入关系数据库,
下边看看这几个业务怎么利用上边去实现:
1、最近30天,北京地区购买A产品的男性用户也购买了那些产品
首先上边北京、男性怎么来的,
A:用户所属区域:可以通过收货地址或者手机归属地解析得出
B:男性:可以通过客户注册资料
为啥要加这三个(时间、区域、性别):
首先,不同地区的客户消费习惯不会太相同,若是你把西藏购买者的购买产品推荐给北京,估计客户会不买账。
其次:不同性别的消费习惯会相差很大,这个就不说了,从男女逛商场的行为就可以看出来。另外:在重要节日,有的产品具有性别特性,比如,女性洁面奶,你推荐给男性,估计客户直接回跳过。
最后,很多产品都有实效性,比如,凉鞋,裙子。你夏天推荐裙子,冬天推荐冲锋衣,估计会被客户骂成SB。当然,30天是我人为定义出来的一个时间段,你可以通过大数据分析出来真正合适的值。
最后说实现思路:
假如上边的PV算出来的结果是
用户、性别、地区、购买日期、购买产品
那么,首先算出最近30天那些人买了A产品,select distinct 用户 from tablepv where 购买产品 =‘A‘ and 性别=‘男‘ and province =‘北京‘ and 当前时间-购买时间<=30天 ,假设结果是 张三、李四、王五
其次:算出这些人都购买了那些产品:
select product,count(distinct 用户) as 人数
from tablepv
where 用户 in ( 张三、李四、王五) and 购买产品 <> ‘A‘ and 性别=‘男‘ and province =‘北京‘ and 当前时间-购买时间<=30天
group by product
order by count(distinct 用户)
2、各种排行
A:给所有用户的
当日热销商品排行(销售量、销售额)
当月热销商品排行(销售量、销售额)
当日店铺排行榜:销售量
当月店铺排行榜:销售量
当日最赞商品排行:产品被赞数量
当月最赞产品排行:产品被赞数量
B:给店铺的
当日本店铺热销产品排行(销售量、销售额)
当月本店铺热销产品排行(销售量、销售额)
C:给商城自营产品的
当日热销产品行业榜(销售量、销售额)
当月热销产品行业榜(销售量、销售额)
最后是大招
各月热销产品榜:
各月热销产品所属小类榜:
这个怎么用呢,首先,可以根据这个分析出来,每个月、季热卖产品分类,其次,我们可以找出这些分类下都有哪些样例产品销售量、销售额最火爆,这样,商城就可以提前进货,赚一把了。
标签:
原文地址:http://www.cnblogs.com/piaolingzxh/p/5727720.html