SVM

时间：2020-10-18 09:44:58 阅读：11 评论：0 收藏：0 [点我收藏+]

标签：算法思路形式通过平衡最小值概率 svm width com

支持向量机简述

技术图片

算法思路：先研究在线性可分训练样本集上如何画出一条直线来分开，然后推广到非线性可分的问题上

如果存在一条直线可以分开圆圈和叉，那么在空间中一定存在着无数条直线可以分开圆圈和叉，那一条直线是最好的？

技术图片

上图中，相比之下，2号线对于误差的容忍程度更多一些

将分界线平行的向两侧移动，直到接触到某个圆圈或叉为止，形成与分界线平行的两条直线，上述中的2号线是使得这两条线距离d最大的直线

技术图片

将距离作为性能指标，且分界的直线需要在另外两条平行线的中间

技术图片

如果是一种不是最优的情况，此时d不是最大值

技术图片

支持向量机的数学描述

支持向量机是一个最大化间隔的方法，将分界线向左移和向右移，与样本点交叉到的向量叫做支持向量

技术图片

支持向量机算法只与支持向量有关，和其他向量没有关系，所以支持向量可以用在小样本的训练上，最终做出来的平行线只与支持向量有关

名词解释及定义：

技术图片

公式1

SVM标准形式：

技术图片 SVM标准形式推导过程描述：

技术图片

在是支持向量的情况下，我们要让d最大

技术图片

由于与表示同一个平面，所以缩放后到平面的距离d不变，而可以变为任意的值，这里让其为1

在所有的支持向量上都等于1，而在其他不是支持向量的位置距离将会大于d

由于当前的w是定值，所以有，所以最终的约束条件是，结合标签y可以写成上述的限制条件

只要训练数据集是线性可分的，一定可以求出一个w和b

性质：

技术图片

支持向量机将整个问题化成了一个凸优化的问题，在这个凸优化的问题上有一个全局最优的解

软间隔分类器

SVM的基本形态是一个硬间隔分类器，它要求所有样本都满足硬间隔约束（即函数间隔要大于1），所以当数据集有噪声点时，SVM为了把噪声点也划分正确，超平面就会向另外一个类的样本靠拢，这就使得划分超平面的几何间距变小，降低模型的泛化性能。除此之外，当噪声点混入另外一个类时，对于硬间隔分类器而言，这就变成了一个线性不可分的问题，于是就使用核技巧，通过将样本映射到高维特征空间使得样本线性可分，这样得到一个复杂模型，并由此导致过拟合（原样本空间得到的划分超平面会是弯弯曲曲的，它确实可以把所有样本都划分正确，但得到的模型只对训练集有效）。

为了解决上述问题，SVM通过引入松弛变量构造了软间隔分类器，它允许分类器对一些样本犯错，允许一些样本不满足硬间隔约束条件，这样做可以避免分类器过拟合，于是也就避免了模型过于复杂，降低了模型对噪声点的敏感性，提升了模型的泛化性能。

因为松弛变量时非负的，因此样本的函数间隔可以比1小。函数间隔比1小的样本被叫做离群点，我们放弃了对这些离群点的精确分类，这对我们的分类器来说是种损失，但是放弃这些点也带来了好处，那就是超平面不必向这些点的方向移动，因而可以得到更大的几何间隔（在低维空间看来，分类边界也更平滑）。显然我们必须权衡这种损失和好处。

松弛变量：松弛变量表示样本离群的程度，松弛变量越大，离群越远，松弛变量为零，则样本没有离群。样本点分类正确为零，如果分类有所偏差则对应一个线性的值， $技术图片$ 是总误差，这个值越小越好，越小代表对训练集的分类越精准