标签:互联网 数据分布 时长 用户 表示 一个用户 标签 pow 网上
一、用户行为数据
一个用户行为表示为6部分,即产生行为的用户和行为的对象、行为的种类、产生行为的上下文、行为的内容和权重。用户行为的统一表示如下:
user id 产生行为的用户的唯一标识
item id 产生行为的对象的唯一标识
behavior type 行为的种类(比如是购买还是浏览)
context 产生行为的上下文,包括时间和地点等
behavior weight 行为的权重(如果是观看视频的行为,那么这个权重可以是观看时长;如果是打分行为,这个权重可以是分数)
behavior content 行为的内容 (如果是评论行为,那么就是评论的文本;如果是打标签的行为,就是标签)
二、用户行为分析
在利用用户行为数据设计推荐算法之前,研究人员首先需要对用户行为数据进行分析,了解数据中蕴含的一般规律,这样才能对算法的设计起到指导作用。
1、用户活跃度和物品流行度的分布:
很多关于互联网数据的研究发现,互联网上的很多数据分布都满足一种称为Power Law的分布,这个分布在互联网领域也称长尾分布。
标签:互联网 数据分布 时长 用户 表示 一个用户 标签 pow 网上
原文地址:https://www.cnblogs.com/Allen-rg/p/11252008.html