【机器学习详解】SMO算法剖析（转载）

时间：2018-02-04 00:26:32 阅读：239 评论：0 收藏：0 [点我收藏+]

【机器学习详解】SMO算法剖析

转载请注明出处：http://blog.csdn.net/luoshixian099/article/details/51227754

C S D N ? 勿 在 浮 沙 筑 高 台

本文力求简化SMO的算法思想，毕竟自己理解有限，无奈还是要拿一堆公式推来推去，但是静下心看完本篇并随手推导，你会迎刃而解的。推荐参看SMO原文中的伪代码。

1.SMO概念

上一篇博客已经详细介绍了SVM原理，为了方便求解，把原始最优化问题转化成了其对偶问题，因为对偶问题是一个凸二次规划问题，这样的凸二次规划问题具有全局最优解，如下：
技术分享图片
其中

2.SMO原理分析

2.1视为一个二元函数

为了求解N个参数

m i n Ψ (α 1, α 2) = 1 2 K 11 α 2 1 + 1 2 K 22 α 2 2 +

其中

2.2视为一元函数

由等式约束得：

α 1 = (ζ ? y 2 α 2) y 1

m i n Ψ (α 2) = 1 2 K 11 ( ζ ? α 2 y 2 ) 2 + 1 2 K 22 α 2

2.3对一元函数求极值点

上式中是关于变量

1.由上式中假设求得了
$ζ = α o l d 1 y 1 + α o l d 2 y 2$
2.假设SVM超平面的模型为 $E i = f (x i) ? y i$ $v 1 = f (x 1) ? \sum j = 1 2 y j α j K 1 j ? b$ $v 2 = f (x 2) ? \sum j = 1 2 y j α j K 2 j ? b$

把(4)(6)(7)带入下式中：

α n e w, u n c l i p p e d 2 = α o l d 2 + y 2 ( E 1 ? E 2 ) η

2.4对原始解修剪

上述求出的解未考虑到约束条件：

在二维平面上直观表达上述两个约束条件
技术分享图片
最优解必须要在方框内且在直线上取得，因此

α n e w 2 = ??????? H , α n e w, u n c l i p p e d 2 > H α

2.5求解

由于其他N-2个变量固定，因此

α n e w 1 = α o l d 1 + y 1 y 2 (α o l d 2 ? α n e w 2)

2.6取临界情况

大部分情况下，有

也可以如下理解，对(3)式求二阶导数就是

带入目标函数(1)内，比较

3.启发式选择变量

上述分析是在从N个变量中已经选出两个变量进行优化的方法，下面分析如何高效地选择两个变量进行优化，使得目标函数下降的最快。

第一个变量的选择

第一个变量的选择称为外循环，首先遍历整个样本集，选择违反KKT条件的

第二个变量的选择

SMO称第二个变量的选择过程为内循环，假设在外循环中找个第一个变量记为

首先在非边界集上选择能够使函数值足够下降的样本作为第二个变量，
如果非边界集上没有，则在整个样本集上选择第二个变量，
如果整个样本集依然不存在，则重新选择第一个变量。

4.阈值b的计算

每完成对两个变量的优化后，要对b的值进行更新，因为b的值关系到f(x)的计算，即关系到下次优化时

b n e w 1 = y 1 ? \sum i = 3 N α i y i K i 1 ? α n e w 1 y 1

y 1 ? \sum i = 3 N α i y i K i 1 = ? E 1 + α o l d 1 y 1 K 11 +

b n e w 1 = ? E 1 ? y 1 K 11 (α n e w 1 ? α o l d 1) ? y 2 K

b n e w 2 = ? E 2 ? y 1 K 12 (α n e w 1 ? α o l d 1) ? y 2 K

建议参看SMO原文的伪代码

参考：
统计学习方法，李航
Sequential Minimal Optimization:A Fast Algorithm for Training Support Vector Machines，John C. Platt
http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html

【机器学习详解】SMO算法剖析（转载）

标签：情况 ble 参数相同全局最优 machines 推荐保存标签

原文地址：https://www.cnblogs.com/Vae1990Silence/p/8411118.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

【机器学习详解】SMO算法剖析（转载）

【机器学习详解】SMO算法剖析

1.SMO概念

2.SMO原理分析

2.1视为一个二元函数

2.2视为一元函数

2.3对一元函数求极值点

2.4对原始解修剪

2.5求解αnew1

2.6取临界情况

3.启发式选择变量

第一个变量的选择

第二个变量的选择

4.阈值b的计算

2.5求解