标签:决策 false class 权重 相加 有用 one 向量 解决方案
3.1 冷启动问题简介
常用解决方案:
3.2 利用用户注册信息
基于用户注册信息的推荐算法其核心问题是计算每种特征的用户喜欢的物品。帮助用户发现他们不容易发现的物品,而不是热门物品。
基本流程:(1)获取用户注册信息;(2)根据注册信息对用户分类;(3)给用户推荐他所属分类中用户喜欢的物品。将推荐列表根据一定的权重相加,得到最终的推荐列表。
3.3 选择合适的物品启动用户的兴趣
在新用户第一次访问推荐系统时,不立即给用户展示推荐结果,而是提供一些物品,根据用户的反馈来提供个性化推荐。
选择启动物品需要具备的特点:
一般可以使用决策树算法构建一个这样的选择启动物品集合的系统。给定一群用户,用这群用户对物品评分的方差度量这群用户兴趣的一致程度。如果方差很大,说明这一群用户的兴趣不太一致,反之则说明这群用户的兴趣比较一致。通过如下方式度量一个物品的区分度D(i):
另一种理解:计算的这个方差,相当于决策树里计算的信息熵,
三项分别还是喜欢、不喜欢、不知道商品i的用户对其他物品评分的方差。决策树算法首先会从所有用户中找到具有最高区分度的物品i,然后将用户分成3类。然后在每类用户中再找到最具区分度的物品,然后将每一类用户又各自分为3类,也就是将总用户分成9类,然后这样继续下去,最终可以通过对一系列物品的看法将用户进行分类。而在冷启动时,我们从根节点开始询问用户对该节点物品的看法,然后根据用户的选择将用户放到不同的分枝,直到进入最后的叶子节点,此时我们就已经对用户的兴趣有了比较清楚的了解,从而可以开始对用户进行比较准确地个性化推荐。
3.4 利用物品的内容信息
对于物品的冷启动问题,一般是利用物品的文本信息,计算物品的词向量,然后根据词向量计算物品的相似性,将其加入相似性矩阵。通过物品内容(文本)计算物品相似性,基于内容的过滤算法。
3.5 发挥专家的作用
针对系统冷启动问题,一般使用专家进行样本标注。
标签:决策 false class 权重 相加 有用 one 向量 解决方案
原文地址:https://www.cnblogs.com/eilearn/p/9860075.html