冬季学期已经结束了,为了迎接即将到来的实习面试。同时,也为了提高自己在机器学习应用领域的能力。我还是决定写一个系列(暂且就叫“机器学习算法应用与实战系列”)的文章,主要还是用于自己以后能够更方便的使用,并能在写机器学习算法或这调用机器学习算法时,对算法有一些新的领会。会不断完善和细化文章的内...
分类:
编程语言 时间:
2015-01-21 11:32:16
阅读次数:
209
现在机器学习算法在分类、回归、数据挖掘等问题上运用的十分广泛,对于初学者来说,可能一听到'算法'或其他的专属名词都感觉高深莫测,以致很多人望而却步,这让很多人在处理很多问题上失去了一个很有用的工具。机器学习的算法并没有那么高深,这里我就用最通俗的语言来细致解释算法的表达的意义,,并且很多人对程序的实...
分类:
系统相关 时间:
2015-01-18 23:54:40
阅读次数:
464
将一种语言自动翻译成另一种语言一直以来都是难以攻克的问题。但最近几年,谷歌通过开发机器翻译算法改变了传统的翻译过程,通过谷歌翻译从本质上改变了跨文化翻译交流。
分类:
编程语言 时间:
2015-01-18 22:40:44
阅读次数:
308
一、Mahout简介查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包.....
分类:
其他好文 时间:
2015-01-18 13:03:31
阅读次数:
308
一. mahout简介:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
以下为在mahout实现的机器学习算法:
算法类...
分类:
其他好文 时间:
2015-01-13 00:09:27
阅读次数:
251
聚类是一种无监督的学习(无监督学习不依赖预先定义的类或带类标记的训练实例),它将相似的对象归到同一个簇中,它是观察式学习,而非示例式的学习,有点像全自动分类。说白了,聚类(clustering)是完全可以按字面意思来理解的——将相同、相似、相近、相关的对象实例聚成一类的过程。机器学习中常见的聚类算法包括 k-Means算法、期望最大化算法(Expectation Maximization,EM,参考“EM算法原理”)、谱聚类算法(参考机器学习算法复习-谱聚类)以及人工神经网络算法,本文阐述的是K-均值聚类算...
分类:
编程语言 时间:
2015-01-07 16:49:33
阅读次数:
245
前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法。 所谓监督学习,就是有训练过程的学习。再确切点,就是有 "分类标签集" 的学习。 现在开始,将进入到非监督学习领域。从经典的聚类问题展开讨论。所谓聚类,就是事先并不知道具体分类方案的分类 (允许知道分类个数)。 本文将介绍一个最为经...
分类:
编程语言 时间:
2015-01-06 17:06:13
阅读次数:
499
R语言:SMOTE - Supersampling Rare Events in R:用R对稀有事件进行超级采样...
分类:
编程语言 时间:
2015-01-04 17:20:29
阅读次数:
3191