Layer Normalization

时间：2017-03-31 20:51:01 阅读：284 评论：0 收藏：0 [点我收藏+]

标签：ova eof normal 计算 lan into 技术 ges nal

Ba, Jimmy Lei, Jamie Ryan Kiros, and Geoffrey E. Hinton. "Layer normalization." arXiv preprint arXiv:1607.06450 (2016).

Batch Normalization是对每个神经元做归一化(cnn是对每个feature map做归一化)，主要是为了解决internal covariate shift的问题。

作者提出，对于RNN这种没法用mini-batch的网络，没办法用BN，所以提出了Layer Normalization。

公式为：

技术分享

两个repo:https://github.com/pbhatia243/tf-layer-norm 和 https://github.com/ryankiros/layer-norm

感觉不管BN还是LN，都是为了限制神经元的输出值，使其符合一定的分布。可以看出，为了得到均值和方差，BN采用了不同batch中不同的输入数据来计，LN采用了同一层上神经元来计算。那么，是否可以通过历史时间数据来计算呢，感兴趣的同学可以自己去实现一个TN(time normalization或者叫temporal normalization )，似乎也是支持RNN的(即独立于mini-batch的)。

Layer Normalization

标签：ova eof normal 计算 lan into 技术 ges nal

原文地址：http://www.cnblogs.com/huangshiyu13/p/6653346.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行