梯度下降随机梯度下降批量梯度下降

时间：2018-09-14 22:53:31 阅读：151 评论：0 收藏：0 [点我收藏+]

梯度下降（GD）

梯度的本意是一个向量，表示某一函数在该点处的方向导数沿着该方向取得最大值，导数对应的是变化率

即函数在该点处沿着该方向变化最快，变化率最大（为该梯度的模）

随机梯度下降（SGD）：每次迭代随机使用一组样本

针对BGD算法训练速度过慢的缺点，提出了SGD算法，普通的BGD算法是每次迭代把所有样本都过一遍，每训练一组样本就把梯度更新一次。而SGD算法是从样本中随机抽出一组，训练后按梯度更新一次，然后再抽取一组，再更新一次，在样本量及其大的情况下，可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的模型了。

批量随即下降（BGD）：每次迭代使用所有样本

在深度学习中数据量非常大时，使用所有样本耗费时将会很长

资料1

梯度下降随机梯度下降批量梯度下降

标签：随机梯度训练范围 .net ref size 变化 target 情况

原文地址：https://www.cnblogs.com/Aaron12/p/9649123.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

梯度下降 随机梯度下降 批量梯度下降

梯度下降随机梯度下降批量梯度下降