码迷,mamicode.com
首页 > 编程语言 > 详细

支持向量机SMO算法求解过程分析

时间:2016-07-10 16:54:07      阅读:342      评论:0      收藏:0      [点我收藏+]

标签:

1.SVM对偶函数最后的优化问题

技术分享

技术分享

            技术分享

            技术分享

2. 对核函数进行缓存

技术分享

由于该矩阵是对称矩阵,因此在内存中的占用空间可以为m(m+1)/2

映射关系为:

技术分享

 

[cpp] view plain copy
 
  1. #define OFFSET(x, y)    ((x) > (y) ? (((x)+1)*(x) >> 1) + (y) : (((y)+1)*(y) >> 1) + (x))  
  2. //...  
  3.     for (unsigned i = 0; i < count; ++i)  
  4.         for (unsigned j = 0; j <= i; ++j)  
  5.             cache[OFFSET(i, j)] = y[i] * y[j] * kernel(x[i], x[j], DIMISION);  
  6. //...  

 

3. 求解梯度

既然α值是变量,因此对α值进行求导,后面根据梯度选取α值进行优化。

梯度:技术分享

 

[cpp] view plain copy
 
  1. for (unsigned i = 0; i < count; ++i)  
  2. {  
  3.     gradient[i] = -1;  
  4.     for (unsigned j = 0; j < count; ++j)  
  5.         gradient[i] += cache[OFFSET(i, j)] * alpha[j];  
  6. }  

 

 

技术分享

若使W最大,则当α减少时,G越大越好。反之,G越小越好。

4. 序列最小化法(SMO)的约束条件

每次选取2个α值进行优化,其它α值视为常数,根据约束条件技术分享得:

技术分享

技术分享

技术分享

 

进行优化之后:

技术分享

5. 制定选取规则

由于α的范围在区间[0,C],所以△α受α约束

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

 

若选取的技术分享技术分享异号,即λ=-1,则技术分享技术分享增减性相同

假设技术分享技术分享

技术分享,则技术分享,此时应选取技术分享

上述命题可化为(注:技术分享技术分享等价)

技术分享

技术分享

 

若选取的技术分享技术分享同号,即λ=1,则技术分享技术分享增减性相异

技术分享,则技术分享,此时应选取技术分享,

上述命题可化为(注:技术分享技术分享等价)

技术分享

技术分享

技术分享

 

将上述结论进行整理,可得(为了简便此处只选取G前的符号与y的符号相异的情况)

技术分享

技术分享

 

[cpp] view plain copy
 
  1. unsigned x0 = 0, x1 = 1;  
  2. //根据梯度选取进行优化的alpha值  
  3. {  
  4.     double gmax = -DBL_MAX, gmin = DBL_MAX;  
  5.     for (unsigned i = 0; i < count; ++i)  
  6.     {  
  7.         if ((alpha[i] < C && y[i] == POS || alpha[i] > 0 && y[i] == NEG) && -y[i] * gradient[i] > gmax)  
  8.         {  
  9.             gmax = -y[i] * gradient[i];  
  10.             x0 = i;  
  11.         }  
  12.         else if ((alpha[i] < C && y[i] == NEG || alpha[i] > 0 && y[i] == POS) && -y[i] * gradient[i] < gmin)  
  13.         {  
  14.             gmin = -y[i] * gradient[i];  
  15.             x1 = i;  
  16.         }  
  17.     }  
  18. }  

 

 

6. 开始进行求解

 

alpha要求在区间[0,C]内,对不符合条件的alpha值进行调整,调整规则如下。 

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

分2种情况,若λ=-1,即:

技术分享

代入后得:

技术分享

技术分享

技术分享

技术分享

 

[cpp] view plain copy
 
  1. if (y[x0] != y[x1])  
  2. {  
  3.     double coef = cache[OFFSET(x0, x0)] + cache[OFFSET(x1, x1)] + 2 * cache[OFFSET(x0, x1)];  
  4.     if (coef <= 0) coef = DBL_MIN;  
  5.     double delta = (- gradient[x0] - gradient[x1]) / coef;  
  6.     double diff = alpha[x0] - alpha[x1];  
  7.     alpha[x0] += delta;  
  8.     alpha[x1] += delta;  
  9.     unsigned max = x0, min = x1;  
  10.     if (diff < 0)  
  11.     {  
  12.         max = x1;  
  13.         min = x0;  
  14.         diff = -diff;  
  15.     }  
  16.     if (alpha[max] > C)  
  17.     {  
  18.         alpha[max] = C;  
  19.         alpha[min] = C - diff;  
  20.     }  
  21.     if (alpha[min] < 0)  
  22.     {  
  23.         alpha[min] = 0;  
  24.         alpha[max] = diff;  
  25.     }  
  26. }  

 

 

若λ=1,即:

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

 

[cpp] view plain copy
 
  1. else  
  2. {  
  3.     double coef = cache[OFFSET(x0, x0)] + cache[OFFSET(x1, x1)] - 2 * cache[OFFSET(x0, x1)];  
  4.     if (coef <= 0) coef = DBL_MIN;  
  5.     double delta = (-gradient[x0] + gradient[x1]) / coef;  
  6.     double sum = alpha[x0] + alpha[x1];  
  7.     alpha[x0] += delta;  
  8.     alpha[x1] -= delta;  
  9.     unsigned max = x0, min = x1;  
  10.     if (alpha[x0] < alpha[x1])  
  11.     {  
  12.         max = x1;  
  13.         min = x0;  
  14.     }  
  15.     if (alpha[max] > C)  
  16.     {  
  17.         alpha[max] = C;  
  18.         alpha[min] = sum - C;  
  19.     }  
  20.     if (alpha[min] < 0)  
  21.     {  
  22.         alpha[min] = 0;  
  23.         alpha[max] = sum;  
  24.     }  
  25. }  



 

然后进行梯度调整,调整公式如下:

技术分享

 

[cpp] view plain copy
 
  1. for (unsigned i = 0; i < count; ++i)  
  2.     gradient[i] += cache[OFFSET(i, x0)] * delta0 + cache[OFFSET(i, x1)] * delta1;  

 

 

7.进行权重的计算

计算公式如下:

技术分享

技术分享

 

 

[cpp] view plain copy
 
  1. double maxneg = -DBL_MAX, minpos = DBL_MAX;  
  2. SVM *svm = &bundle->svm;  
  3. for (unsigned i = 0; i < count; ++i)  
  4. {  
  5.     double wx = kernel(svm->weight, data[i], DIMISION);  
  6.     if (y[i] == POS && minpos > wx)  
  7.         minpos = wx;  
  8.     else if (y[i] == NEG && maxneg < wx)  
  9.         maxneg = wx;  
  10. }  
  11. svm->bias = -(minpos + maxneg) / 2;  

 

代码地址:http://git.oschina.net/fanwenjie/SVM-iris/

支持向量机SMO算法求解过程分析

标签:

原文地址:http://www.cnblogs.com/fanwenjie/p/5657768.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!