前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。目录Mahout...
分类:
编程语言 时间:
2014-10-29 09:09:46
阅读次数:
331
阅读导读:
1.什么是聚类分析?
2.Mahout中的kmeans算法,默认的分融符是什么?
3.用kmeans算法得到的结果有什么特点?
1.
聚类算法kmeans
聚类分析是数据挖掘及机器学习领域内的重点问题之一,在数据挖掘、模式识别、决策支持、机器学习及图像分割等领域有广泛的应用,是最重要的数据分析方法之一。聚类是在给定的数据集合中寻找同类的数据子集合,每一...
分类:
其他好文 时间:
2014-10-29 00:25:22
阅读次数:
359
阅读导读:
1.简述用Mahout实现协同过滤ItemCF的步骤?
2.如何用API实现Hadoop的各种HDFS命令?
3.Kmeans.java类报错,暂时可以怎么处理?
1.
Mahout开发环境介绍
在用Maven构建Mahout项目文章中,我们已经配置好了基于Maven的Mahout的开发环境,我们将继续完成Mahout的分步式的程序开发。
本文的...
分类:
其他好文 时间:
2014-10-26 14:23:16
阅读次数:
297
阅读导读:
1.Mahout0.7版本和其他Mahout版本的有什么区别?
2.简述Mahout方法中算法实现过程?
3.R语言和Mahout生成的点,并不是重合的,原因有哪些?
1.开发环境
开发环境
Win7 64bit
Java 1.6.0_45
Maven 3
Eclipse Juno Service Relea...
分类:
其他好文 时间:
2014-10-25 11:52:47
阅读次数:
275
环境:
hadoop-2.5.0-cdh5.2.0
mahout-0.9-cdh5.2.0
引言
虽然Mahout已经宣布不再继续基于Mapreduce开发,迁移到Spark,但是实际面临的情况是公司集群没有足够的内存支持Spark这只把内存当饭吃的猛兽,再加上项目进度的压力以及开发人员的技能现状,所以不得不继续使用Mahout一段时间。
今天记录...
分类:
编程语言 时间:
2014-10-24 16:36:02
阅读次数:
268
环境:
hadoop-2.5.0-cdh5.2.0
mahout-0.9-cdh5.2.0
步骤:
基本思路是,将mahout下的所有jar包都引入hadoop的classpath即可,所以修改了$HADOOP_HOME/etc/hadoop/hadoop-env.sh,添加如下代码将mahout的所有jar包引入hadoop的classpath:
f...
分类:
其他好文 时间:
2014-10-23 19:21:42
阅读次数:
317
随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓娶管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具,首选的是Hadoop平台。Hadoop在可..
分类:
其他好文 时间:
2014-10-15 21:41:12
阅读次数:
350
推荐引擎简介 推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人...
分类:
Web程序 时间:
2014-10-15 19:37:51
阅读次数:
480
1.在elcipse上建立一个java project 项目名:mymahout2.建立libs文件夹,在mahout 0.9的lib文件夹下找到一下java包其中log4j.properties可在hadoop文件夹下找到。把他们放到libs文件夹下。3.把文件夹libs复制到mymahout项目...
分类:
系统相关 时间:
2014-10-15 12:23:50
阅读次数:
305