标签:本质 ack mil 变化 综合 标签 大数 数据 point
用户画像相关知识点
1、用户画像是什么?
用户画像(User Profile),即用户信息标签化。
用户画像有很多的的标签组成,每个标签都规定了观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。
2、为什么需要用户画像?
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理。
大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。
用户画像的本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。
3、用户画像怎么设计?
一个标签通常是人为规定的高度精炼的特征标识。
3、1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
3.1.1 静态信息数据
用户相对稳定的信息。
3.1.2 动态信息数据
用户不断变化的行为信息。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。
3.3 数据建模方法
如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
3.3.1 什么用户
关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
3.3.2 什么时间
时间包括两个重要信息,时间戳+时间长度。
时间戳,为了标识用户行为的时间点。
时间长度,为了标识用户在某一页面的停留时间。
3.3.3 什么地点
用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。
3.3.4 什么内容
每个url网址(页面/屏幕)中的内容。
对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
3.3.5 什么事
用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。
用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。
4、用户画像怎么开发?
5、用户画像工作坚持的原则(金融企业)
标签:本质 ack mil 变化 综合 标签 大数 数据 point
原文地址:http://www.cnblogs.com/ahu-lichang/p/7074857.html