标签:推出 学生 价值 针对性 ext cap 分布 构建流程 体验
简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。
除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。
用户画像的作用罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然了,这是极其错误的用法。
其作用大体不离以下几个方面:
数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
还得一提的是,储存用户行为数据时最好同时储存下发生该行为的场景,以便更好地进行数据分析。
行为建模该阶段是对上阶段收集到数据的处理,进行行为建模,以抽象出用户的标签,这个阶段注重的应是大概率事件,通过数学算法模型尽可能地排除用户的偶然行为。
这时也要用到机器学习,对用户的行为、偏好进行猜测,好比一个 y=kx+b 的算法,X 代表已知信息,Y 是用户偏好,通过不断的精确k和b来精确Y。
在这个阶段,需要用到很多模型来给用户贴标签。
该阶段可以说是二阶段的一个深入,要把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致地标签化。
为什么说是基本成型?因为用户画像永远也无法100%地描述一个人,只能做到不断地去逼近一个人,因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。
关于“标签化”,一般采用多级标签、多级分类,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。
数据可视化分析这是把用户画像真正利用起来的一步,在此步骤中一般是针对群体的分析,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营。
如图:
这里只写了用户画像的构建流程和一些原理,下次有时间我会写篇关于大数据平台的实践文章,并说一下一些行为模型的算法原理,有兴趣的朋友可以关注我的博客 http://www.luoyuchu.com 。
参考阅读:
[1]永洪BI:手把手教您搞定用户画像
[2]易观智库:大数据下的用户分析(PPT)
[3]杨步涛:基于用户画像的大数据挖掘实践
[4]慕课网:电商大数据应用之用户画像
[5]知乎:Alex Chu 关于用户画像的回答
作为阿里广告部门的数据分析师,我目前工作中涉及到的数据分析主要可以分为:行业研究、产品/业务数据支持以及人群洞察(用户画像)。今天就和大家分享下我在用户画像数据分析中一些心得体会。
什么是用户画像:
用户画像,又称人群画像,是根据用户人口统计学信息、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化画像。构建用户画像的核心工作即是给用户贴“标签”,而标签中部分是根据用户的行为数据直接得到,部分是通过一系列算法或规则挖掘得到。直接得到的数据比较好理解,比如用户在网站或APP上主动填写和上传的数据,严格一些平台(比如电商平台)会要求用户上传身份证、学生证、驾驶证、银行卡等,这样的数据准确性就较高,因此毫无疑问阿里和腾讯在用户基础数据的准确性上甩百度几条街。通过算法和数据挖掘得到的标签可以这么理解:如果一个用户最近开始购买母婴类商品(比如一段的奶粉,New Baby的纸尿布),那么可以根据用户购买的频次及数量,结合用户的年龄、性别推断是否为新妈妈/爸爸。
BAT用户画像数据浅析:
百度:
百度数据类型广泛,主要包含搜索数据、百度知道、百度贴吧及百度地图等数据,但是这些数据很少可以精确到个体用户层面,搜索大数据可以预测流行病爆发时间、世界杯的胜负概率及城市拥堵状况,总之百度的数据在宏观层面有不少应用,但是在微观的用户画像层面,百度毫无优势,大部分人还没有百度账号呢,百度的用户体系最近几年也是靠一些APP慢慢完善起来的。
腾讯:
腾讯的数据优势在社交数据,此外随着微信/QQ支付的普及,腾讯也有了用户身份证、银行卡等数据。腾讯的数据积累年限久远、维度丰富,从QQ、Qzone、腾讯微博到微信,腾讯涵盖兴趣偏好、地理位置、人口统计学信息等等数据,且准确性也不低。
腾讯在用户画像数据方面有很广泛的维度,且在兴趣、心理特征等标签上有很高的准确性。
阿里:
据统计,2015年阿里巴巴活跃用户数为4.07亿,覆盖98.5%的中国互联网购物人群。其中,移动月度活跃用户达到3.93亿,占整个中国手机网民的64%,这意味着六成以上的中国手机网民都是淘宝或天猫移动端的活跃用户。(以上相关数据摘自“阿里妈妈电商营销”微信公众号)
目前阿里的数据标签已经逐步整理到阿里的数据超市——GProfile全局档案。GProfile 全局档案是以消费者档案为核心构建内容,通过分析消费者的基础信息、购物行为以描绘其特征画像。在阿里数据的平台上,GProfile 主要根据用户在历史时间内的网购行为记录,从网购时间点、内容深度剖析,提供用户基础属性、社交行为、互动行为、消费行为、偏好习惯、财富属性、信用属性和地理属性八大类标签服务。此外,从数据能力来说,阿里的数据还可结合优酷土豆视频数据、CNZZ友盟媒体数据、虾米天天动听音乐数据等。(以上相关内容摘自“阿里数据”微信公众号)
阿里数据的特点是真实、可靠,随着公司收购其他数据类平台,阿里的数据类型也逐渐丰富起来,在用户画像数据方面,阿里可谓彻彻底底的真人数据。
(以上对百度和腾讯数据的分析会有不少推断和猜测,不妥之处,欢迎指正。)
用户画像的价值:
1:精准营销。精准营销是用户画像或者标签最直接和有价值的应用。这部分也是我们广告部门最注重的工作内容。当我们给各个用户打上各种“标签”之后,广告主(店铺、商家)就可以通过我们的标签圈定他们想要触达的用户,进行精准的广告投放。无论是阿里、还是腾讯很大一部分广告都是通过这种方式来触达用户,百度的搜索广告方式有所不同。
2:助力产品。一个产品想要得到广泛的应用,受众分析必不可少。产品经理需要懂用户,除了需要知道用户与产品交互时点击率、跳失率、停留时间等行为之外,用户画像能帮助产品经理透过用户行为表象看到用户深层的动机与心理。
3:行业报告与用户研究。通过对用户画像的分析可以了解行业动态,比如90后人群的消费偏好趋势分析、高端用户青睐品牌分析、不同地域品类消费差异分析等等。这些行业的洞察可以指导平台更好的运营、把握大方向,也能给相关公司(中小企业、店铺、媒体等)提供细分领域的深入洞察。
感想:
用户画像是对人的深入挖掘,除了基本的人口统计学信息、地理位置、设备资产等客观属性之外,如兴趣偏好等是自由度很大的标签,在很多应用题场景,广告主(或需求方)更需要用户兴趣、价值观、人格层面的标签。比如汽车客户,环保类的电动车品牌想要触达的是有环保意识、喜欢小排量的用户,这就涉及到人的价值观层面了,因此制作这些标签的时候不能仅仅通过用户行为直接产生,需要更深入人格的建模。随着互联网野蛮生长时代的消退以及数据技术的进一步提升,从人心理、人格层面的深度分析将逐渐得到重视和应用。我十分期待阿里能构建一套基于人格心理学的标签,这必将给淘宝带来更好的用户体验,增加我这种不喜欢花哨页面用户的停留时间。
标签:推出 学生 价值 针对性 ext cap 分布 构建流程 体验
原文地址:http://www.cnblogs.com/KingIceMou/p/7508184.html