码迷,mamicode.com
首页 > 其他好文 > 详细

牛顿法与梯度下降法数学公式推导过程

时间:2019-10-05 16:44:37      阅读:88      评论:0      收藏:0      [点我收藏+]

标签:bsp   目标   一个   mamicode   最小值   time   变化   梯度   过程   

迭代更新数学公式推导过程

1、牛顿法

首先对于有n个变量的函数的一阶导数为

         技术图片

其次对于其二阶导数为:

         技术图片

 

 

之后关于目标函数的包含二阶导数的泰勒展开式为:

         技术图片

这时将技术图片看成技术图片的函数,则根据函数的最小值性质,当偏导数等于0时出取得,从而得到技术图片技术图片,所以技术图片根据等式的特点得到,只有两者都取0时才能使等式等于0,所以得:  

    技术图片(最小值)

     技术图片技术图片 技术图片 技术图片

    技术图片技术图片

 

     技术图片技术图片

故牛顿法的迭代公式为:

       技术图片

 

 

 

2、梯度下降法

在开始推导之前,来介绍一下一个概念:梯度(当前函数位置的导数),同时它也表示某一函数在该点处的方向导数沿着该方向取得较大值。

       梯度:技术图片

 

  之后这里给出一阶泰勒展开式

           技术图片

由于技术图片都是矢量,则技术图片也是矢量,则根据矢量与向量的关系,这时我们可以用一个单位向量V(下一步将要变化的方向)与标量的乘积来表示:技术图片,而技术图片

 

 便是我们所说的步进长度。这时技术图片表达式为:技术图片

 

又由我们的目的出发,所以可以我们希望通过这个迭代变化使技术图片技术图片小,以此达到最小值。所以由公式技术图片,当梯度方向技术图片技术图片成反方向时,能最大程度的朝着局部下降的方向变化,使技术图片取得最大值。根据技术图片技术图片的数学关系,这时可以得出技术图片技术图片的计算关系:技术图片(一般情况,单位向量都是正向的)

    技术图片技术图片

    技术图片(由于是标量,可以把它与步进长度合到一起)

     技术图片

故梯度下降法的迭代公式为:

     技术图片 

 

牛顿法与梯度下降法数学公式推导过程

标签:bsp   目标   一个   mamicode   最小值   time   变化   梯度   过程   

原文地址:https://www.cnblogs.com/Justina/p/11624672.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!