tensorflow-正则化与指数衰减率

时间：2018-11-25 21:18:00 阅读：189 评论：0 收藏：0 [点我收藏+]

标签：网络 lam ima gradient global 很多复杂 layer 图片

指数衰减率
先用较大的学习率快速迭代，得到一个较优的解。然后，指数衰减法生效，随着迭代的继续逐步减少学习率，这样，可以得到更稳定的解。
decayed_learning_rate=learning_rate*decay_rate^(global_step/decay_steps)
decay_rate衰减系数
decay_steps衰减速度
当staircase为True，则global_step/decay_steps为整数（学习率下降阶梯），否则为浮点数（学习率下降平滑）。

globalStep=tf.Variable(0)
learningRate=tf.train.exponential_decay(0.1,globalStep,100,0.96,staircase=True)
learningStep=tf.train.GradientDescentOptimizer(learningRate).minimize(losss,global_step=globalStep)

正则化
正则化可避免过拟合，模型的复杂程度，由神经网络的所有参数决定，w和b，一般是由权重w决定。
1.L1正则化
L1:
技术分享图片
L2:

L1使参数变得稀疏，很多参数会为0，这样，可以达到类似特征提取的作用。L1不可导。
L2公式可导，所以对其优化更简洁，但其没有稀疏作用。
可将2个正则化一起使用

#L2
loss=tf.reduce_mean(tf.square(y_-y)+tf.contrib.layers.l2_regularizer(lambda)(w)
#lambda为正则化权重,即：R(w)*lambda
#L1
loss=tf.reduce_mean(tf.square(y_-y)+tf.contrib.layers.l1_regularizer(lambda)(w)

tensorflow-正则化与指数衰减率

标签：网络 lam ima gradient global 很多复杂 layer 图片

原文地址：http://blog.51cto.com/13959448/2321783

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行