码迷,mamicode.com
首页 > 其他好文 > 详细

SVM支持向量机

时间:2019-01-29 12:03:45      阅读:252      评论:0      收藏:0      [点我收藏+]

标签:实战   引入   坐标   线性   inf   约束   最好   表达式   最优   

 

一、SVM模型

  1.函数间隔与几何间隔

   技术分享图片

    (1)公式化问题。

      分类模型:

        技术分享图片

      函数间隔:前面乘以y(i),是为了保持数值为正值,数据点到直线的距离。函数间隔最好的是几何间隔最大的那个。最好的分类线就是几何间隔最大的分类线

        技术分享图片

      我们要找到最好的直线,对每个数据点都计算出函数间隔,对于一个直线而言可以计算出最小函数间隔,这个最小的函数间隔可以判断直线和数据集的拟合程度。

      只要成倍的增大w和b值,函数间隔就能无限增大。-1和1的二阶范数是根号2

      几何间隔:

    技术分享图片

      初始函数表达式:最大化集合间隔,使得所有的数据点都大于等于这个集合间隔,||w||二阶范数就是欧氏距离,两点相减然后求二阶范数,就是法向量的求法。

      技术分享图片

      非凸性约束,容易达到局部最优。

    技术分享图片

    核心思想:我们要找到一个分类面,使得在线性可分的时候,这条直线是最好的

          点到直线的距离可以理解为置信度,当点离分类界面越远的时候,

          那么点对分类的置信度比较高,当点比较接近直线边缘的时候,点对分类的置信度比较低。

    简化步骤1:

  技术分享图片

    简化步骤2:调整w和b,将r变为1,所以索性直接变为1

    技术分享图片

    最终问题:

      技术分享图片

    线性约束下优化二次函数

      有数学方法可以 解决这个问题,可以引入对偶函数

  2.最优间隔分类器

  3.拉格朗日求解

   (1)最小化一个f(w),技术分享图片

   (2)构造拉个朗日函数技术分享图片

   (3)求解:技术分享图片

   (4)有不等式约束的时候:

    技术分享图片

   (5)拉格朗日方程:

    技术分享图片

   (6)极小极大

    技术分享图片

   技术分享图片

    (7)广义拉个朗日函数

      对偶问题与原始问题的等价性:技术分享图片

      约束不等式g都是凸函数:线性函数都是凸函数

      约束等式h都是仿射函数:仿射和线性等价,除了允许截距b

      不等式严格执行:必有g不等式是小于0的

      技术分享图片

      技术分享图片

  4.最优间隔分类器求解

技术分享图片

  技术分享图片

    技术分享图片

技术分享图片

 技术分享图片

    技术分享图片

技术分享图片

  最有间隔分类器求解

    技术分享图片

  5.SMO算法 

    坐标上升法:技术分享图片

  技术分享图片

    二维坐标上升法:

    技术分享图片

    技术分享图片

技术分享图片

  6.核技法

 

    

 

  7.软间隔分类器

  8.合页损失函数

  9.多分类

二、SVM实战文本分类

 

SVM支持向量机

标签:实战   引入   坐标   线性   inf   约束   最好   表达式   最优   

原文地址:https://www.cnblogs.com/bigdata-stone/p/10333142.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!