标签:com data- 渠道 status ima 淘宝 男女比例 htbox err
随着国家开放二胎政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度分析,分析市场需求,定位产品方向,从而在满足市场需求的同时,提高销量。
数据源来自阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
包含两张表,购买商品表和婴儿信息表
购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期
婴儿信息表字段信息:用户ID 出生日期 性别
相关指标
提出问题
1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?
2.哪类商品最热销,可主推?
3.用户年龄段、性别对于销量的影响?如何做到精准营销?
分析思路
1、选择子集
考虑到属性字段,都是一些编号,没办法具体分析,因此去除该字段
2、列名重命名
这里把英文名改成中文名称
3、一致化处理
两张表都需要对日期进行处理,转换成标准的日期格式,text函数进行格式化统一
4、数据整合
使用vlookup,根据用户id,匹配婴儿相关信息,但是整合后发现有很多数据无法匹配到婴儿信息,因此在后续关于婴儿相关分析的时候只会提取能匹配上的部分数据
异常值处理
关于婴儿性别,0代表女,1代表男,2代表未知,要对2的异常数据进行处理,这里按照男女比例进行大概处理,
男女比例为:438:489 ,总共26个异常值,因此把12个替换成1,14个替换成0
利用if函数替换成男和女
1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?
1.首先,对销量进行多维度拆解,分成【新用户购买量】 和 【老用户购买量】,分别进行分析,但是经过计算,该测试数据,老用户的复购率特别低,因此可以忽略,直接从新用户购买数量,在时间维度上进行分析。
下图是商品的总体走势
接下来我们看看每年的每个月的走势对比
通过走势分析发现,在每年的5月,9月,11月都有不同程度的高峰凸起,整体呈现上涨趋势,接下来分析,为什么销量上涨,
2.这里可以采用4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析。
产品维度
假设:新增产品类带来销量的上升
收集证据:下面是每年各月的二级分类商品数目对比
标签:com data- 渠道 status ima 淘宝 男女比例 htbox err
原文地址:https://www.cnblogs.com/wgwg/p/13195665.html