先来看一下使用流程:1)拿到DataModel2)定义相似度计算模型PearsonCorrelationSimilarity3)定义用户邻域计算模型NearestNUserNeighborhood4)定义推荐模型GenericUserBasedRecommender5)进行推荐 @Test pu.....
分类:
Web程序 时间:
2014-11-24 16:40:53
阅读次数:
202
假设向量1为(a1,a2,...an)
向量2为(b1,b2,...bn)
1、欧式距离测度
公式为
d=sqrt((a1-b1)^2+(a2-b2)^2+…+(an-bn)^2)
mahout类为EuclideanDistanceMeasure
2、平方欧式距离测度
公式为
d=(a1-b1)^2+(a2-b2)^2+…+(an-bn)^2
mahout类为SquaredEuc...
分类:
其他好文 时间:
2014-11-23 20:17:54
阅读次数:
232
mahout三种向量:
在mahout中,向量被实现为三个不同的类,每个类都是针对不同场景优化的:DenseVector、RandomAccessSparseVector和SequentialAccessSparseVector。
1、DenseVector可被视为一个double型数组,其大小为数据中的特征个数。因为不管数组的元素之是不是0,数组中所有元素都被预先分配了空间。我们称之为密集的...
分类:
其他好文 时间:
2014-11-23 17:34:29
阅读次数:
181
说明:参考Mahout FP算法相关相关源码。算法工程可以在下载:(只是单机版的实现,并没有MapReduce的代码)使用FP关联规则算法计算置信度基于下面的思路:1. 首先使用原始的FP树关联规则挖掘出所有的频繁项集及其支持度;这里需要注意,这里是输出所有的频繁项集,并没有把频繁项集合并,所以需要修改FP树的相关代码,在某些步骤把所有的频繁项集输出;(ps:参考Mahout的FP树单机版的实现,...
分类:
编程语言 时间:
2014-11-19 15:58:12
阅读次数:
262
要做推荐,用户行为数据是基础。用户行为数据有哪些字段呢?mahout的DataModel支持,用户ID,ItemID是必须的,偏好值(用户对当前Item的评分),时间戳 这四个字段{@code userID,itemID[,preference[,timestamp]]}mahout数据源支持从文件...
分类:
Web程序 时间:
2014-11-18 23:40:26
阅读次数:
247
协同过滤源码路径:~/project/javaproject/mahout-0.9/core/src $tree main/java/org/apache/mahout/cf/taste/ -L 2main/java/org/apache/mahout/cf/taste/├── common│ ├─...
分类:
Web程序 时间:
2014-11-18 13:23:01
阅读次数:
819
转载自(http://www.geek521.com/?p=1423)Mahout推荐算法分为以下几大类GenericUserBasedRecommender算法:1.基于用户的相似度2.相近的用户定义与数量特点:1.易于理解2.用户数较少时计算速度快GenericItemBasedRecommen...
分类:
编程语言 时间:
2014-11-13 15:56:05
阅读次数:
187
基于 Apache Mahout 实现高效的协同过滤推荐 Apache Mahout 是 Apache Software Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用...
分类:
编程语言 时间:
2014-11-13 13:07:07
阅读次数:
270
1.迭代式mapreduce ? ?? ???一些复杂的任务难以用一次MapReduce处理完成,需要多次 MapReduce 才能完成任务,例如Pagrank,K-means算法都需要多次的迭代,关于 MapReduce 迭代在Mahout中运用较多。有兴趣的...
分类:
其他好文 时间:
2014-11-12 19:53:00
阅读次数:
175
优化推荐系统的JVM关键参数-Xmx设定Java允许使用的最大堆空间。例如-Xmx512m表示堆空间上限为512MB-server现代JVM有两个重要标志:-client和-server,分别为客户端程序(运行时间短、占用资源少)和服务器端程序(长时间运行、资源密集型)选择合适的JVM配置。-d32...
分类:
其他好文 时间:
2014-11-11 15:55:12
阅读次数:
255