2.1 用户行为数据简介 用户行为数据可分为显性反馈行为和隐性反馈行为; 用户数据的统一表示; 2.2 用户行为分析 在设计推荐算法之前需要对用户行为数据进行分析,了解数据中蕴含的一般规律可以对算法的设计起到指导作用。 用户活跃度和物品流行度 均近似符合长尾分布:e.g. 物品流行度定义:对用户产生 ...
分类:
其他好文 时间:
2018-10-27 23:38:27
阅读次数:
525
用户的行为数据介绍:
用户的行为主要分为两种-显性反馈行为 和 隐性反馈行为 ,显性反馈行为主要包括 评分 和喜欢/不喜欢 ,youtube最早是使用是使用五分评价系统的,但是只有用户很不满意和特别满意的情况下才会评分,因此又把它变成了二级评分系统。 隐式反馈行为就是页面的浏览行为。
用户的行为分析:
用户的数据分布大都满足一种长尾分布,就是 每个单词出现的频率和他在热门排...
分类:
其他好文 时间:
2016-05-12 16:11:58
阅读次数:
821
你可能不知道的一些机器学习事儿
最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。
(1)随机森林模型不适合用稀疏特征。
(2)测试集必须使用与训练集相同的方法进行预处理。
(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;
L2正则(旋转不变)最小样本...
分类:
其他好文 时间:
2015-08-31 21:44:15
阅读次数:
234
本笔记为自己学习之用,对笔记内容感兴趣的读者还请购买正版书籍《推进系统实践》,尊重作者著作权益!第2章 利用用户行为数据2.1 用户行为数据简介2.2 用户行为分析 2.2.1 用户活跃度和物品流行度的分布 Power Law,长尾分布 2.2.2 用户活跃度和物品流行度的关系 基于用户...
分类:
其他好文 时间:
2015-05-22 23:44:42
阅读次数:
160