支持向量机原理(四)SMO算法原理

时间：2017-04-07 18:26:42 阅读：262 评论：0 收藏：0 [点我收藏+]

　　在SVM的前三篇里，我们优化的目标函数最终都是一个关于

1. 回顾SVM优化目标函数

　　　　我们首先回顾下我们的优化目标函数：

m i n  α 1 2 \sum i = 1 , j = 1 m α i α j y i y j K ( x i

s . t .

0 \leq α i \leq C

　　　　我们的解要满足的KKT条件的对偶互补条件为：

α ? i (y i (w ? ? ? (x i) + b ?) ? 1) = 0

　　　　根据这个KKT条件的对偶互补条件，我们有：

α ? i = 0 ? y i (w ? ? ? (x i) + b) \geq 1

0 \leq α ? i \leq C ? y i (w ? ? ? (x i) + b) = 1

α ? i = C ? y i (w ? ? ? (x i) + b) \leq 1

　　　　由于

α ? i = 0 ? y i g (x i) \geq 1

0 \leq α ? i \leq C ? y i g (x i) = 1

α ? i = C ? y i g (x i) \leq 1

2. SMO算法的基本思想

　　　　上面这个优化式子比较复杂，里面有m个变量组成的向量

　　　　为了后面表示方便，我们定义

　　　　由于

s . t .

0 \leq α i \leq C

3. SMO算法目标函数的优化

　　　　为了求解上面含有这两个变量的目标优化问题，我们首先分析约束条件，所有的

　　　　根据上面的约束条件

技术分享

　　　　由于

L \leq α n e w 2 \leq H

　　　　而对于L和H，我们也有限制条件如果是上面左图中的情况，则

L = m a x (0, α o l d 2 ? α o l d 1)

　　　　如果是上面右图中的情况，我们有：

L = m a x (0, α o l d 2 + α o l d 1 ? C)

　　　　也就是说，假如我们通过求导得到的

α n e w 2 = ????? H α n e w, u n c 2 L L \leq α n e w, u

　　　　那么如何求出

　　　　首先我们整理下我们的目标函数。

　　　　为了简化叙述，我们令

E i = g (x i) ? y i = \sum j = 1 m α ? j y j K (x i, x j) + b ?

　　　　其中

g (x) = w ? ? ? (x) + b = \sum j = 1 m α ? j y j K (x, x j) +

　　　　我们令

v i = \sum i = 3 m y j α j K (x i, x j) = g (x i) ? \sum i = 1

　　　　这样我们的优化目标函数进一步简化为：

W (α 1, α 2) = 1 2 K 11 α 2 1 + 1 2 K 22 α 2 2 + y 1 y 2 K

　　　　由于

α 1 = y 1 (? ? α 2 y 2)

　　　　将上式带入我们的目标优化函数，就可以消除

W (α 2) = 1 2 K 11 ( ? ? α 2 y 2 ) 2 + 1 2 K 22 α 2 2 + y 2

　　　　忙了半天，我们终于可以开始求

? W ? α 2 = K 11 α 2 + K 22 α 2 ? 2 K 12 α 2 ? K 11 ? y

　　　　整理上式有：

(K 11 + K 22 ? 2 K 12) α 2 = y 2 (y 2 ? y 1 + ? K 11 ? ? K

= y 2 (y 2 ? y 1 + ? K 11 ? ? K 12 + (g (x 1) ? \sum j = 1 2 y

　　　　将

(K 11 + K 22 ? 2 K 12) α n e w, u n c 2 = y 2 ((K 11 + K

　　　　我们终于得到了

α n e w, u n c 2 = α o l d 2 + y 2 ( E 1 ? E 2 ) K 11 + K

　　　　利用上面讲到的

4. SMO算法两个变量的选择

　　　　SMO算法需要选择合适的两个变量做迭代，其余的变量做常量来进行优化，那么怎么选择这两个变量呢？

4.1 第一个变量的选择

　　　　SMO算法称选择第一个变量为外层循环，这个变量需要选择在训练集中违反KKT条件最严重的样本点。对于每个样本点，要满足的KKT条件我们在第一节已经讲到了：

α ? i = 0 ? y i g (x i) \geq 1

0 \leq α ? i \leq C ? y i g (x i) = 1

α ? i = C ? y i g (x i) \leq 1

　　　　一般来说，我们首先选择违反

4.2 第二个变量的选择

　　　　SMO算法称选择第二一个变量为内层循环，假设我们在外层循环已经找到了

　　　　如果内存循环找到的点不能让目标函数有足够的下降，可以采用遍历支持向量点来做

4.3 计算阈值b和差值

　　　　在每次完成两个变量的优化之后，需要重新计算阈值b。当

y 1 ? \sum i = 1 m α i y i K i 1 ? b 1 = 0

　　　　于是新的

b n e w 1 = y 1 ? \sum i = 3 m α i y i K i 1 ? α n e w 1

　　　　计算出

E 1 = g (x 1) ? y 1 = \sum i = 3 m α i y i K i 1 + α o l d

　　　　可以看到上两式都有

b n e w 1 = ? E 1 ? y 1 K 11 (α n e w 1 ? α o l d 1) ?

　　　　同样的，如果

b n e w 2 = ? E 2 ? y 1 K 12 (α n e w 1 ? α o l d 1) ?

　　　　最终的

b n e w = b n e w 1 + b n e w 2 2

　　　　得到了

E i = \sum S y j α j K (x i, x j) + b n e w ? y i

　　　　其中，S是所有支持向量

　　　　好了，SMO算法基本讲完了，我们来归纳下SMO算法。

5. SMO算法总结

　　　　输入是m个样本

　　　　输出是近似解

　　　　1)取初值

　　　　2)按照4.1节的方法选择

α n e w, u n c 2 = α k 2 + y 2 ( E 1 ? E 2 ) K 11 + K 22

　　　　3)按照下式求出

α k + 1 2 = ????? H α n e w, u n c 2 L L \leq α n e w, u

　　　　4)利用

　　　　5)按照4.3节的方法计算

　　　　6）在精度e范围内检查是否满足如下的终止条件：

\sum i = 1 m α i y i = 0

0 \leq α i \leq C, i = 1, 2... m

α k + 1 i = 0 ? y i g (x i) \geq 1

0 \leq α k + 1 i \leq C ? y i g (x i) = 1

α k + 1 i = C ? y i g (x i) \leq 1

　　　　7)如果满足则结束，返回

　　　　SMO算法终于写完了，这块在以前学的时候是非常痛苦的，不过弄明白就豁然开朗了。希望大家也是一样。写完这一篇， SVM系列就只剩下支持向量回归了，胜利在望!

支持向量机原理(四)SMO算法原理

标签：结束表达式 preview element ble als 变量范围步骤

原文地址：http://www.cnblogs.com/zhengxingpeng/p/6679256.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

支持向量机原理(四)SMO算法原理

1. 回顾SVM优化目标函数

2. SMO算法的基本思想

3. SMO算法目标函数的优化

4. SMO算法两个变量的选择

4.1 第一个变量的选择

4.2 第二个变量的选择

4.3 计算阈值b和差值EiEi

5. SMO算法总结

4.3 计算阈值b和差值