标签:梯度下降 alt image blank tar 方式 png 权重 sch
引入动量(Momentum)方法一方面是为了解决“峡谷”和“鞍点”问题;一方面也可以用于SGD 加速,特别是针对高曲率、小幅但是方向一致的梯度。
Momentum 梯度下降法,就是计算了梯度的指数加权平均数,并以此来更新权重,它的运行速度几乎总是快于标准的梯度下降算法。
标签:梯度下降 alt image blank tar 方式 png 权重 sch
原文地址:https://www.cnblogs.com/yibeimingyue/p/11795660.html