码迷,mamicode.com
首页 > 其他好文 > 详细

Batch Normalization的正确打开方式

时间:2020-04-28 09:57:42      阅读:60      评论:0      收藏:0      [点我收藏+]

标签:滑动   ali   for   format   batch   模型   输入   表示   div   

这里有几个重要参数需要注意:

  • axis的值取决于按照input的哪一个维度进行BN,例如输入为channel_last format,即[batch_size, height, width, channel],则axis应该设定为4,如果为channel_first format,则axis应该设定为1.
  • momentum的值用在训练时,滑动平均的方式计算滑动平均值moving_mean和滑动方差moving_variance。 后面做更详细的说明。
  • centerTrue时,添加位移因子beta到该BN层,否则不添加。添加beta是对BN层的变换加入位移操作。注意,beta一般设定为可训练参数,即trainable=True
  • scaleTrue是,添加缩放因子gamma到该BN层,否则不添加。添加gamma是对BN层的变化加入缩放操作。注意,gamma一般设定为可训练参数,即trainable=True
  • training表示模型当前的模式,如果为True,则模型在训练模式,否则为推理模式。要非常注意这个模式的设定,这个参数默认值为False。如果在训练时采用了默认值False,则滑动均值moving_mean和滑动方差moving_variance都不会根据当前batch的数据更新,这就意味着在推理模式下,均值和方差都是其初始值,因为这两个值并没有在训练迭代过程中滑动更新。


作者:Aspirinrin
链接:https://www.jianshu.com/p/437fb1a5823e
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Batch Normalization的正确打开方式

标签:滑动   ali   for   format   batch   模型   输入   表示   div   

原文地址:https://www.cnblogs.com/zb-ml/p/12791744.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!