聚类介绍 本章包含 1 实战操作了解聚类 2.了解相似性概念 3 使用mahout执行一个简单的聚类实例 4.用于聚类的各种不同的距离測算方法 作为人类,我们倾向于与志同道合的人合作—“鸟的羽毛聚集在一起。我们可以发现反复的模式通过联系在我们的记忆中的我们看到的、听到的、问道的、尝到的东 西。 比如 ...
分类:
编程语言 时间:
2017-07-21 10:43:55
阅读次数:
165
大数据量存储:分布式存储 日志处理: Hadoop擅长这个 海量计算: 并行计算 ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库 使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统 机器学习: 比如Apache ...
分类:
其他好文 时间:
2017-07-18 18:44:06
阅读次数:
148
Mahout和Hadoop:机器学习的基本原理这可能是现在收益最高,也是最受欢迎的一项技术之一。毫无疑问——作为开发人员,机器学习是一个能够大展身手的舞台。计算技术通常用来分析数据,而理解数据则依赖于机器学习。多年来,对于大多数开发者来说,机器学习却是非常遥远、一直是..
分类:
其他好文 时间:
2017-07-14 16:42:38
阅读次数:
130
一、Mahout简介Mahout是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。ApacheMahout项目已经发展到了它的第三个年头,目前已经有了三个公共发行版本。Mahout包含许多实现..
分类:
其他好文 时间:
2017-07-07 20:12:07
阅读次数:
190
软件版本号:windows7: Tomcat7、JDK7、Spring4.0.2、Struts2.3、Hibernate4.3、myeclipse10.0、easyui;Linux(centos6.5):Hadoop2.4、Mahout1.0、JDK7;使用Webproject调用Mahout的相关 ...
分类:
编程语言 时间:
2017-07-04 21:50:55
阅读次数:
198
Mahout 模糊KMeans 一、算法流程 模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每一个数据点属于某个聚类的程度的一种聚类算法。1973 年,Bezdek 提出了该算法,作为早期硬 C 均值聚类(HCM)方法的一种改进。 FCM 把 n 个向量 xi(i=1 ...
分类:
其他好文 时间:
2017-07-02 19:03:13
阅读次数:
199
map-reduce入门 近期在改写mahout源代码,感觉自己map-reduce功力不够深厚,因此打算系统学习一下。 map-reduce事实上是一种编程范式,从统计词频(wordCount)程序来解说map-reduce的思想最easy理解。 给定一个文件,里面的内容例如以下,要求统计每一个单 ...
分类:
其他好文 时间:
2017-06-24 21:56:15
阅读次数:
128
Mahout学习 1、Mahout是什么? Mahout是一个算法库,集成了很多算法。 Apache Mahout 是 Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。 Ma ...
分类:
其他好文 时间:
2017-06-24 18:43:43
阅读次数:
212
来源:http://www.douban.com/note/245740667/ 提问1: 博涛前辈,您好!打搅您了,我想请教您一些问题。我是一名在读研一学生。研究推荐系统方面的知识。 我一直非常困惑,在实际应用中,给定一个应用系统。比如淘宝,或者给定一个应用系统积累的数据集,怎样用推荐系统的思想着 ...
分类:
其他好文 时间:
2017-06-16 18:23:46
阅读次数:
246
开源框架Mahout配置机器学习这两年特别火,ATB使劲开百万到几百万年薪招美国牛校的机器学习方向博士,作为一个技术控,也得折腾下,就这样来初步折腾下Mahout这个机器学习的主流开源框架。一、Mahout简介Mahout的中文意思:驭象的人,再看看Mahout的logo,骑在象头上的那个Maho..
分类:
其他好文 时间:
2017-06-08 18:06:52
阅读次数:
296