码迷,mamicode.com
首页 > 编程语言 > 详细

支持向量机(SVM)算法分析——周志华的西瓜书学习

时间:2018-09-03 10:32:55      阅读:669      评论:0      收藏:0      [点我收藏+]

标签:决定   www   ima   bar   基本   seq   分析   code   min   

1.线性可分

对于一个数据集:

技术分享图片

如果存在一个超平面X能够将D中的正负样本精确地划分到S的两侧,超平面如下:

技术分享图片

那么数据集D就是线性可分的,否则,不可分。

 w称为法向量,决定了超平面的方向;b为位移量,决定了超平面与原点的距离。

样本空间中的任意点x到超平面X的距离(不太熟悉的可以复习高数中空间几何那一章的内容)可以写为:

技术分享图片

使得下面两式成立的训练样本技术分享图片称为支持向量:

技术分享图片

两个异类支持向量(一个等于+1,一个等于-1)到超平面的距离之和为:

技术分享图片

它称之为“间隔”

技术分享图片

 想找到最大间隔的划分超平面,就是使技术分享图片最大:

技术分享图片

等价于:

技术分享图片

这就是支持向量机的基本模型。

对偶问题:

上式的拉格朗日函数可写为:

技术分享图片

其中,技术分享图片

对参数w和b求导可得:

技术分享图片

将上式带入到拉格朗日函数中,消去w和b,得到对偶表达式:

技术分享图片

技术分享图片

采用SMO算法完成对偶问题的求解:

原始论文地址:http://www-ai.cs.uni-dortmund.de/LEHRE/SEMINARE/SS09/AKTARBEITENDESDM/FOLIEN/Joerg_Nitschke_Sequential_minimal_optimization.pdf

 

支持向量机(SVM)算法分析——周志华的西瓜书学习

标签:决定   www   ima   bar   基本   seq   分析   code   min   

原文地址:https://www.cnblogs.com/wzdLY/p/9577121.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!