码迷,mamicode.com
首页 > 其他好文 > 详细

关于对偶最优化

时间:2014-05-09 19:27:28      阅读:3028      评论:0      收藏:0      [点我收藏+]

标签:style   blog   ext   color   http   c   

我发现,想要了解一个领域的比较快速的方法就是去读本领域近几年的硕士和博士毕业论文(中文的就行)!

 

拉格朗日对偶

今天学习了拉格朗日对偶。我们首先考虑下面这个问题bubuko.com,布布扣

    bubuko.com,布布扣    

我们记

    bubuko.com,布布扣    

(这里如果bubuko.com,布布扣是一个向量的话,那么相应的bubuko.com,布布扣也是一个向量),则上述最优化问题可以等价于问题bubuko.com,布布扣

    bubuko.com,布布扣    

于是我们现在似乎可以开始求解问题bubuko.com,布布扣了,最通常的求解过程就是先找到bubuko.com,布布扣的最优解bubuko.com,布布扣,次最优解显然是bubuko.com,布布扣的函数,然后将这个最优解bubuko.com,布布扣带入问题bubuko.com,布布扣继续求bubuko.com,布布扣的最优解bubuko.com,布布扣,就可以得到问题bubuko.com,布布扣的最优解为bubuko.com,布布扣但是,通过这种方法来求解其实和直接求解bubuko.com,布布扣是一样的(本段结束后举个例子来说明)。于是,我们可以使用一个称为"对偶"的思想来解决这个问题。部分解决。

下面举个例子来说明,假设我们想求解问题:

     bubuko.com,布布扣,bubuko.com,布布扣是一个方阵 bubuko.com,布布扣是一个向量

那么它的等价形式是

    bubuko.com,布布扣

我们首先求解max,结果如下:

    bubuko.com,布布扣

带入bubuko.com,布布扣可得:

    bubuko.com,布布扣

这等价于原问题,相当于什么忙都没帮上,还是回到了原点。

 

 

下面我们介绍拉格朗日对偶来处理此问题。我们定义"拉格朗日对偶函数"为:

    bubuko.com,布布扣    

相应的"拉格朗日对偶问题"bubuko.com,布布扣定义为:

    bubuko.com,布布扣    

我们可以立刻得到bubuko.com,布布扣bubuko.com,布布扣之间的关系,当bubuko.com,布布扣bubuko.com,布布扣时我们有

    bubuko.com,布布扣

上面的第三个不等式是由于bubuko.com,布布扣的取值范围从bubuko.com,布布扣扩大到了bubuko.com,布布扣,大范围内的最小值肯定大于小范围内的最小值。这一点很关键!因为正是由于这个原因,可以把"bubuko.com,布布扣必须满足bubuko.com,布布扣"这个条件从限制条件中去除掉。这是一个比"bubuko.com,布布扣"难处理的条件,去掉它当然有很大的益处。从上式中我们得到:

    bubuko.com,布布扣    

于是更进一步,我们有下式:

    bubuko.com,布布扣    

而我们一开始就提到bubuko.com,布布扣等价于bubuko.com,布布扣,那么将bubuko.com,布布扣带入便可得到:

    bubuko.com,布布扣    

可得:

    bubuko.com,布布扣    

我们发现现在所有对自变量的约束仅剩下bubuko.com,布布扣,而bubuko.com,布布扣这个约束条件不见了,如果我们能使得的等号成立,那么我们就可以得到更好的结果。我们考虑如下可能:如果能够取等,并且关于bubuko.com,布布扣的两组最优解(bubuko.com,布布扣bubuko.com,布布扣)也相等的话,那么我们可以通过交换max和min的求解顺序来求解最初的问题。因为bubuko.com,布布扣通常是难解的,所以我们便可以通过这种办法转化为去求解bubuko.com,布布扣。假设bubuko.com,布布扣,我们将bubuko.com,布布扣带入bubuko.com,布布扣得打bubuko.com,布布扣,再求解bubuko.com,布布扣得到bubuko.com,布布扣,于是的最优解便是bubuko.com,布布扣

补充一下,当然我们也可以通过bubuko.com,布布扣然后bubuko.com,布布扣的方法来求最优解bubuko.com,布布扣,不过这样就相当于直接求解bubuko.com,布布扣的等价命题bubuko.com,布布扣,上面我已经谈论过这条路是个死胡同了,因此先求max再求min是行不通的,只能先min后max。

 

 

下面引入"鞍点"概念,阐述什么情况下不等号能取等。

鞍点似乎多种定义,大概分为两大类,第一类所定义出的鞍点的意义包括着第二类定义出的。

第一种一般这样定义:

[1]当一个可微函数bubuko.com,布布扣的驻点不是极值点时,该驻点也称为bubuko.com,布布扣的一个鞍点。伍胜健,《数学分析(第三册)》 ,北京大学出版社,p.96.

[2]A saddle point is a point in the domain of a function that is a stationary point but not a local extremum. Wikipedia page:Saddle point.

第二种一般这样定义:

若存在定义域内的点bubuko.com,布布扣使得对定义域内的任意bubuko.com,布布扣,都有bubuko.com,布布扣,则称点bubuko.com,布布扣为函数bubuko.com,布布扣的一个鞍点。"鞍点定理在Lagrange乘数法上的应用",大学数学,Vol.25, NO.2, Apr.2009.

 

从下图中我们可以看出,原点显然满足鞍点的第一个定义,但是不满足鞍点的第二种定义,因为在两个坐标轴方向函数值都增加。由于问题的需要,在本文中我们采用第二种鞍点定义方法。这样做可能会使得一些函数得不到求解,如下图中的函数,但这类函数总可以通过坐标变换使得满足第二类鞍点定义。

bubuko.com,布布扣

 

我们首先举出一个特例说明形如bubuko.com,布布扣bubuko.com,布布扣是有可能存在鞍点的。我们取bubuko.com,布布扣,取bubuko.com,布布扣,在集合bubuko.com,布布扣中任取一个作为bubuko.com,布布扣,那么可以很容易的验证此bubuko.com,布布扣满足bubuko.com,布布扣

现在,我们假设bubuko.com,布布扣存在鞍点bubuko.com,布布扣(此鞍点在定义域bubuko.com,布布扣内),那么对任意的bubuko.com,布布扣,都有此关系bubuko.com,布布扣,所以有:

    bubuko.com,布布扣

结合式可得:

    bubuko.com,布布扣    

记问题bubuko.com,布布扣的最优解为bubuko.com,布布扣,结合,并且由于bubuko.com,布布扣bubuko.com,布布扣的等价性,我们立即可得

    bubuko.com,布布扣

带入式得到:

    bubuko.com,布布扣    

从第三个不等式我们可以得bubuko.com,布布扣,若bubuko.com,布布扣存在某个分量bubuko.com,布布扣使得bubuko.com,布布扣,那么bubuko.com,布布扣,这说明在bubuko.com,布布扣中至少存在一个分量bubuko.com,布布扣。这与bubuko.com,布布扣的存在性相矛盾。所以bubuko.com,布布扣,进一步可以得到bubuko.com,布布扣。于是,我们得到了这个称为"KKT最优化条件"的结果:

    bubuko.com,布布扣    

也正是因为这个条件,才使得许多算法拥有稀疏性,比如SVM。因为很多实际问题中向量bubuko.com,布布扣的大多数分量都不为零,这使得相对应于这些非零分量的bubuko.com,布布扣的分量必须为零,因此bubuko.com,布布扣是稀疏的。

将式带入式可得:

    bubuko.com,布布扣    

并且通过上一段的推导,我们还得到了bubuko.com,布布扣满足问题bubuko.com,布布扣的约束条件bubuko.com,布布扣,于是我们求得了问题bubuko.com,布布扣的一个最优解bubuko.com,布布扣

 

另外,今天了解到如何求鞍点已经有许多相当成熟的算法:直接法,预条件Krylov子空间法,MINRES算法,基于Uzawa类型的迭代方法,SOR算法,AOR算法。暂时只只知道他们的名字,还不知道它们长啥样。

 

现在我们还剩下两个问题:bubuko.com,布布扣什么时候存在满足定义域限制bubuko.com,布布扣的鞍点bubuko.com,布布扣呢?如果bubuko.com,布布扣不存在鞍点,那又如何求解问题bubuko.com,布布扣呢?

 

 

 

关于对偶最优化,布布扣,bubuko.com

关于对偶最优化

标签:style   blog   ext   color   http   c   

原文地址:http://www.cnblogs.com/mashiqi/p/3719101.html

(0)
(2)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!