标签:
本篇文章对不同阶段的SVM进行一个梳理和总结,不管是初级版的SVM,还是升级版的SVM,你都会发现其实在SVM中一直是有两个核心在贯穿其中的,相信看完本篇的学习,你就会对SVM这个重要级的分类器有个全面的了解,或者有自己的体会,好吧,开始吧,Good luck。。
对于任何非线性方法,如果对特征进行适当的变换,那么久总可以得到相应的线性方法,但是这种变换有时会带来两个方面的问题:
1)变换后特征空间维数必定变大,而且大多数情况下是随着样本原特征维数的增加以及非线性程度的增加而呈指数增加,最终将导致算法无法继续;
2)虽然特征空间维数增加,但是原始样本数却没有增加,决策函数中要估计的参数也会增加,导致复杂度升高,因此推广能力就差;
但是呢,对于SVM大大来说,这些问题那都不叫事,谁让它有两大制胜法宝捏,分分钟解决问题哈哈。SVM有两个核心思想:1)大间隔:通过最大化分类间隔来保证好的推广能力,解决上面第二个问题;2)核函数:通过核函数定义的内积函数间接地实现对特征的非线性变换,然后用新空间中的线性问题求解原空间中的非线性问题,避免高维运算,解决第一个问题。好啦,这两个思想非常非常重要,它们给人们在后续的研究中产生了很大的灵感和启发(后续学习你会看到这种启发),希望你慢慢体会。
现在的你,是不是对SVM有个全面的认识了呢,如果有,恭喜你,现在可以动手自己应用辣。。
实际应用中,你会发现,SVM较传统模式识别方法以及ANN方法在分类性能上都要有很大优势,而且SVM对核函数的选择不怎么敏感,基本上前面讲过的三种核函数应用起来结果没什么差别。
支持向量机最初发表是在1992年和1995年,在当时并没有引起人们很大的关注,直到90年代末期,随着机器学习和模式识别的崛起,引发了对SVM大量研究的巨浪。其最早的应用是由其创始人Vapnik带领的AT&T实验室开展的手写体数字识别的实验项目,当时所用的数据是美国邮政USPS的手写数字库,实际测试中取得了错误率为4.0%的最好成绩。比较典型的应用是在OCR、人脸识别、文本识别、DNA序列分析等。
比较有影响力的有:
LibSVM:http://www.csie.ntu.edu.tw/~cjlin/libsvm/
:http://svmlight.joachims.org/
SVMTorch:http://bengio.abracadoudou.com/SVMTorch.html
当然还有其他的库,可以在http://www.kernel-machines.org/software上找到。
模式识别(Pattern Recognition)学习笔记(二十四)--总结:SVM学习资源
标签:
原文地址:http://blog.csdn.net/eternity1118_/article/details/51669078