还在用mahout吗,matlab,R,你已经out了,快来拥抱真正的分布式机器学习神器--spark machine learning,体验它强大的并发式计算能力,卓越的内存式运算性能,支持众多的算法包,以及scala语言的简洁!...
分类:
其他好文 时间:
2015-02-12 16:16:49
阅读次数:
627
很幸运找到这篇文件,解了燃眉之急。http://blog.csdn.net/pan12jian/article/details/38703569mahout做推荐的输入只能是long类型,但在某些网站中,存储的数据不是long类型,是string类型。现在的手机APP,每个手机都有其device_i...
分类:
其他好文 时间:
2015-02-11 18:23:36
阅读次数:
137
前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。目录Mahout...
分类:
编程语言 时间:
2015-02-11 16:21:05
阅读次数:
305
一、 用Maven搭建Mahout的开发环境
package com.panguoyuan.mahout.itemcf;
import java.io.File;
import java.io.IOException;
import java.util.List;
import org.apache.mahout.cf.taste.common.TasteException;
impor...
分类:
其他好文 时间:
2015-02-05 11:21:44
阅读次数:
308
昨天终于hadoop的项目验收完成了,终于可以松一口气了,总体还是比较满意的。
首先说一下项目流程,用mapreduce对数据进行预处理,然后用mahout中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。
根据老师交给我们的数据,包括Google+和Twitter的部分社交网络数据。以下是两个数据下载的链接
http://snap.stanford.ed...
分类:
其他好文 时间:
2015-01-27 18:24:46
阅读次数:
237
mahout作为开源软件包,集成了很多机器学习和数据挖掘算法,详细可见 mahout官网 。
关于LDA,这里就不说了,详见大神的
LDA数学八卦 。这里只是想吐嘈mahout官网lda的使用文档:根本就没什么文档嘛!
在mahout-0.9及以前版本,只支持hadoop1.0 . 支持hadoop2.0的mahout只有1.0-SNAPSHOT , 不过是可以用的。现...
分类:
其他好文 时间:
2015-01-23 13:28:21
阅读次数:
214
一、Mahout简介查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包.....
分类:
其他好文 时间:
2015-01-18 13:03:31
阅读次数:
308
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra,...
分类:
Web程序 时间:
2015-01-13 01:28:23
阅读次数:
278
一. mahout简介:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
以下为在mahout实现的机器学习算法:
算法类...
分类:
其他好文 时间:
2015-01-13 00:09:27
阅读次数:
251
mahout中map-reduce版的itembased推荐算法思想
最近想写一个map-reduce版的userbased,于是先研究mahout中已实现的itembased算法。itembased看起来简单,但是深入到实现细节还是有点复杂的,用map-reduce实现就更复杂了。
itembased的本质:
预测某用户user对某物品item的打分,
看看该用户对其他...
分类:
编程语言 时间:
2015-01-13 00:08:08
阅读次数:
202