码迷,mamicode.com
首页 > 其他好文 > 详细

【转载】梯度下降法

时间:2015-04-20 22:22:50      阅读:211      评论:0      收藏:0      [点我收藏+]

标签:

梯度下降法[编辑]

(重定向自最速下降法
 

梯度下降法是一个最优化算法,通常也称为最速下降法

 

 

描述[编辑]

技术分享
 
有关梯度下降法的描述

梯度下降法,基于这样的观察:如果实值函数 技术分享 在点 技术分享 处可微且有定义,那么函数 技术分享在 技术分享 点沿着梯度相反的方向 技术分享 下降最快。

因而,如果

技术分享

对于 技术分享 为一个够小数值时成立,那么 技术分享

考虑到这一点,我们可以从函数 技术分享 的局部极小值的初始估计 技术分享 出发,并考虑如下序列 技术分享 使得

技术分享

因此可得到

技术分享

如果顺利的话序列 技术分享 收敛到期望的极值。注意每次迭代步长 技术分享 可以改变。

右侧的图片示例了这一过程,这里假设 技术分享 定义在平面上,并且函数图像是一个形。蓝色的曲线是等高线(水平集),即函数 技术分享 为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。(一点处的梯度方向与通过该点的等高线垂直)。沿着梯度下降方向,将最终到达碗底,即函数 技术分享 值最小的点。

例子[编辑]

梯度下降法处理一些复杂的非线性函数会出现问题,例如Rosenbrock函数

技术分享

其最小值在 技术分享 处,数值为技术分享。但是此函数具有狭窄弯曲的山谷,最小值 技术分享 就在这些山谷之中,并且谷底很平。优化过程是之字形的向极小值点靠近,速度非常缓慢。

技术分享

下面这个例子也鲜明的示例了"之字"的上升(非下降),这个例子用梯度上升(非梯度下降)法求 技术分享 的极大值(非极小值,实际是局部极大值)。

技术分享技术分享

 

缺点[编辑]

由上面的两个例子,梯度下降法的缺点是 [1]:

  • 靠近极小值时速度减慢。
  • 直线搜索可能会产生一些问题。
  • 可能会‘之字型‘地下降。

参阅[编辑]

参考文献[编辑]

  • Mordecai Avriel (2003). Nonlinear Programming: Analysis and Methods. Dover Publishing. ISBN 0-486-43227-0.
  • Jan A. Snyman (2005). Practical Mathematical Optimization: An Introduction to Basic Optimization Theory and Classical and New Gradient-Based Algorithms.Springer Publishing. ISBN 0-387-24348-8

【转载】梯度下降法

标签:

原文地址:http://www.cnblogs.com/daleloogn/p/4442570.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!