码迷,mamicode.com
首页 >  
搜索关键字:mahout    ( 315个结果
Apache mahout 源码阅读笔记-DataModel之UserBaseRecommender
先来看一下使用流程:1)拿到DataModel2)定义相似度计算模型PearsonCorrelationSimilarity3)定义用户邻域计算模型NearestNUserNeighborhood4)定义推荐模型GenericUserBasedRecommender5)进行推荐 @Test pu.....
分类:Web程序   时间:2014-11-24 16:40:53    阅读次数:202
mahout中得距离测度
假设向量1为(a1,a2,...an) 向量2为(b1,b2,...bn) 1、欧式距离测度 公式为 d=sqrt((a1-b1)^2+(a2-b2)^2+…+(an-bn)^2) mahout类为EuclideanDistanceMeasure 2、平方欧式距离测度 公式为 d=(a1-b1)^2+(a2-b2)^2+…+(an-bn)^2 mahout类为SquaredEuc...
分类:其他好文   时间:2014-11-23 20:17:54    阅读次数:232
mahout向量
mahout三种向量: 在mahout中,向量被实现为三个不同的类,每个类都是针对不同场景优化的:DenseVector、RandomAccessSparseVector和SequentialAccessSparseVector。 1、DenseVector可被视为一个double型数组,其大小为数据中的特征个数。因为不管数组的元素之是不是0,数组中所有元素都被预先分配了空间。我们称之为密集的...
分类:其他好文   时间:2014-11-23 17:34:29    阅读次数:181
Fp关联规则算法计算置信度及MapReduce实现思路
说明:参考Mahout FP算法相关相关源码。算法工程可以在下载:(只是单机版的实现,并没有MapReduce的代码)使用FP关联规则算法计算置信度基于下面的思路:1. 首先使用原始的FP树关联规则挖掘出所有的频繁项集及其支持度;这里需要注意,这里是输出所有的频繁项集,并没有把频繁项集合并,所以需要修改FP树的相关代码,在某些步骤把所有的频繁项集输出;(ps:参考Mahout的FP树单机版的实现,...
分类:编程语言   时间:2014-11-19 15:58:12    阅读次数:262
Apache mahout 源码阅读笔记--DataModel之FileDataModel
要做推荐,用户行为数据是基础。用户行为数据有哪些字段呢?mahout的DataModel支持,用户ID,ItemID是必须的,偏好值(用户对当前Item的评分),时间戳 这四个字段{@code userID,itemID[,preference[,timestamp]]}mahout数据源支持从文件...
分类:Web程序   时间:2014-11-18 23:40:26    阅读次数:247
Apache mahout 源码阅读笔记--协同过滤, PearsonCorrelationSimilarity
协同过滤源码路径:~/project/javaproject/mahout-0.9/core/src $tree main/java/org/apache/mahout/cf/taste/ -L 2main/java/org/apache/mahout/cf/taste/├── common│ ├─...
分类:Web程序   时间:2014-11-18 13:23:01    阅读次数:819
Mahout推荐算法基础
转载自(http://www.geek521.com/?p=1423)Mahout推荐算法分为以下几大类GenericUserBasedRecommender算法:1.基于用户的相似度2.相近的用户定义与数量特点:1.易于理解2.用户数较少时计算速度快GenericItemBasedRecommen...
分类:编程语言   时间:2014-11-13 15:56:05    阅读次数:187
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤(二)
基于 Apache Mahout 实现高效的协同过滤推荐 Apache Mahout 是 Apache Software Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用...
分类:编程语言   时间:2014-11-13 13:07:07    阅读次数:270
MapReduce的组合式,迭代式,链式
1.迭代式mapreduce ? ?? ???一些复杂的任务难以用一次MapReduce处理完成,需要多次 MapReduce 才能完成任务,例如Pagrank,K-means算法都需要多次的迭代,关于 MapReduce 迭代在Mahout中运用较多。有兴趣的...
分类:其他好文   时间:2014-11-12 19:53:00    阅读次数:175
JVM调优(这里主要是针对优化基于颁布式Mahout的推荐引擎)
优化推荐系统的JVM关键参数-Xmx设定Java允许使用的最大堆空间。例如-Xmx512m表示堆空间上限为512MB-server现代JVM有两个重要标志:-client和-server,分别为客户端程序(运行时间短、占用资源少)和服务器端程序(长时间运行、资源密集型)选择合适的JVM配置。-d32...
分类:其他好文   时间:2014-11-11 15:55:12    阅读次数:255
315条   上一页 1 ... 20 21 22 23 24 ... 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!