机器学习数学基础- gradient descent算法（下）

时间：2015-07-05 15:11:33 阅读：173 评论：0 收藏：0 [点我收藏+]

Gradient Descent算法

续上文。
gradient descent的用途：

可以用于求解一个函数 $f(x_1,x_2,......x_n)$ 的local 最小值。

关于local最小值：

一个函数可能有多个local最小值，所谓local最小值是当给定（ $x_1,x_2,......x_n$ ）的某一个实例，如果在该实例的无限小的附近的任何一个实例的 $f$ 值都大于该实例的 $f$ 值，那么该实例所对应的就是 $f$ 的一个local最小值。

gradient descent算法求解local最小值的方法如下：

任意给定（ $x_1,x_2,......x_n$ ）的一个实例，简写为 $x^*$ ，那么将 $x^*$ 朝着 $\nabla f(x^*)$ （注：是一个n维向量）的反向方向移动一个足够小的值，得到 $x^*-r\nabla f(x^*)$ ，其中 $r$ 是一个足够小的数值，会使得 $f(x^*-r\nabla f(x^*))$ 的值比 $f(x^*)$ 一定会更小。通过这种方法不断的迭代计算新的 $x$ 的值，最终能得到local的最小值。

如果回想函数的gradient的定义，就能自然的理解gradient descent算法：

gradient反映的是因变量对自变量的变化的敏感性以及正负相关性，这里我们利用的是正负相关性，也就是说当 $\nabla f(x^*)$ 为正时，说明当 $x$ 从 $x^*$ 向负向移动一个足够小的值时， $f$ 的值会减小；并且，当 $\nabla f(x^*)$ 为负时，说明当 $x$ 从 $x^*$ 向正向移动一个足够小的值时， $f$ 的值会减小。因此，只要将 $x$ 从 $x^*$ 朝着 $\nabla f(x^*)$ 的反向方向移动一个足够小的值，就会导致 $f$ 值减小。

如果还不能理解这段话，说明应该回过头去再好好理解下gradient的基本概念了。

机器学习数学基础- gradient descent算法（下）

标签：机器学习梯度下降 gradient

原文地址：http://blog.csdn.net/upnow2014/article/details/46762349

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行