码迷,mamicode.com
首页 >  
搜索关键字:mahout    ( 315个结果
Mahout实现的算法
在Mahout实现的机器学习算法见下表算法类算法名中文名分类算法Logistic Regression逻辑回归Bayesian贝叶斯SVM支持向量机Perceptron感知器算法Neural Network神经网络Random Forests随机森林Restricted Boltzmann Mach...
分类:编程语言   时间:2015-04-02 01:16:53    阅读次数:178
mahout探索之旅——CART分类回归算法
CART算法原理与理解 CART算法的全称是分类回归树算法,分类即划分离散变量;回归划分连续变量。他与C4.5很相似,但是一个二元分类,采用的是类似于熵的GINI指数作为分类决策,形成决策树之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法。 GINI指数 GINI指数主要是度量数据划分或训练数据集D的不纯度为主,系数值的属性作为测试属性,GINI值越小,表明样本的纯净度越高...
分类:编程语言   时间:2015-04-01 22:02:53    阅读次数:324
探索推荐引擎内部的秘密
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规...
分类:其他好文   时间:2015-03-31 18:20:14    阅读次数:132
Mahout的安装与配置
Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。 Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。下载Maho...
分类:其他好文   时间:2015-03-29 17:54:37    阅读次数:147
Hadoop家族学习路线图
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra,...
分类:其他好文   时间:2015-03-13 12:28:34    阅读次数:218
Mahout学习路线图
前言Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的...
分类:其他好文   时间:2015-03-13 12:19:15    阅读次数:132
mahout RecommenderJob 参数含义
--input(path): 存储用户偏好数据的目录,该目录下可以包含一个或多个存储用户偏好数据的文本文件;--output(path): 结算结果的输出目录--similarityClassname (classname): 向量相似度计算类,可选的相似度算法包括CityBlockSimilari...
分类:其他好文   时间:2015-03-12 18:33:00    阅读次数:152
Mahout案例实战--Dating Recommender 系统
软件版本:Hadoop:2.6.0; Mahout:1.0(自行编译,只使用了两个jar文件);Spring:4.0.2;Struts:2.3;Hibernate:4.3;jQuery EasyUI :1.3.6;MySql:5.6;浏览器:chrome;MyEclipse:10.0;Hadoop平台配置:node1:  NameNode/ResourceManger/DataNode/NodeM...
分类:其他好文   时间:2015-03-11 01:58:18    阅读次数:146
Mahout Naive Bayes中文新闻分类示例
一、简介 关于Mahout的介绍,请看这里:http://mahout.apache.org/ 关于Naive Bayes的资料,请戳这里: Mahout实现了Naive Bayes分类算法,这里我用它来进行中文的新闻文本分类。 官方有一组分类例子,使用20 newsgroups data (htt...
分类:其他好文   时间:2015-03-07 18:24:12    阅读次数:241
Mahout快速入门教程
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。 一、Mahout安装、配置 1、下载并解压Mahout http://archive.apac...
分类:其他好文   时间:2015-03-07 17:15:35    阅读次数:554
315条   上一页 1 ... 16 17 18 19 20 ... 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!