快速排序也是根据分治策略设计的一种高效率的分类算法。首先回顾下分类算法的分类思想:它从待分类序列S中随机取出一个元素x,并把S分成三个子序列S1,S2和S3,分别是S中小于,等于和大于x的元素序列,而后对S1和S2递归使用本算法,就可以得到排好序的序列。实际操作中通常不分出序列S2,而是直接把S2中...
分类:
编程语言 时间:
2015-03-15 18:13:03
阅读次数:
149
一、简介 关于Mahout的介绍,请看这里:http://mahout.apache.org/ 关于Naive Bayes的资料,请戳这里: Mahout实现了Naive Bayes分类算法,这里我用它来进行中文的新闻文本分类。 官方有一组分类例子,使用20 newsgroups data (htt...
分类:
其他好文 时间:
2015-03-07 18:24:12
阅读次数:
241
SVM1.概述?\Rightarrow brief introductionSVM全称Support_Vector_Machine,即支持向量机,是机器学习中的一种监督学习分类算法,一般用于二分类问题。对于线性可分的二分类问题,SVM可以直接求解,对于非线性可分问题,其也可以通过核函数将低维映射到高维空间从而转变为线性可分。对于多分类问题,SVM经过适当的转换,也能加以解决。相对于传统的分类算法如l...
分类:
其他好文 时间:
2015-03-05 00:26:34
阅读次数:
316
一、K-近邻算法 ????K-近邻算法是一种分类算法,分类算法是监督学习算法,监督学习算法和无监督学习算法的最大区别就是监督学习需要告诉机器一些正确的事物,也就是训练数据集,而无监督学习算法则不需要事先...
分类:
编程语言 时间:
2015-02-28 18:58:10
阅读次数:
223
从决策树学习谈到贝叶斯分类算法、EM、HMM引言 近期在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描写叙述下自己所知道的几种分类或聚类算法(当然,这全然不代表你将来的面试中会遇到此类问题,仅仅是由于我的简历上写了句:熟悉常见的聚类 & 分类算法而已),而我向来恨对...
分类:
编程语言 时间:
2015-02-20 18:33:53
阅读次数:
780
Java中关于HashMap的使用和遍历分类:算法与数据结构2011-10-19 10:535345人阅读评论(0)收藏举报hashmapjavastringobjectiteratorlist1:使用HashMap的一个简单例子[java]view plaincopypackagecom.pb.c...
分类:
编程语言 时间:
2015-02-13 18:06:24
阅读次数:
216
宅在家无聊之余决定看着《概率论和数理统计》&《统计学习方法》总结一下朴素贝叶斯和贝叶斯估计。
正好这一块我最近温习了一下,我从一开始条件概率开始写,把我所理解的贝叶斯分类算法完整呈现一下吧。
学的概率论最开始是在高中,当时是条件概率,给出条件概率的定义:事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”。
其次...
分类:
其他好文 时间:
2015-02-12 09:25:16
阅读次数:
229
关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。 既然要对分类算法进行评价,那么我们自然得有评价依据。到目前为止,我们讨论分类的有效性都是基于分类成功率来说的,但是这个指标科学吗...
分类:
编程语言 时间:
2015-02-09 12:45:01
阅读次数:
288
http://www.blogjava.net/zhenandaci/archive/2008/08/31/225966.html前文提到过,除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息...
分类:
编程语言 时间:
2015-02-04 20:05:44
阅读次数:
282
朴素贝叶斯分类 1.1、摘要 ?????? 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一个正式的定义。然...
分类:
其他好文 时间:
2015-01-28 19:56:09
阅读次数:
293