码迷,mamicode.com
首页 > 其他好文 > 详细

Batch Normalization层

时间:2018-05-14 19:49:02      阅读:105      评论:0      收藏:0      [点我收藏+]

标签:fit   机构   论文   权重   orm   因此   改变   作用   用处   

  Batch Normalization的加速作用体现在两个方面:一是归一化了每层和每维度的scale,所以可以整体使用一个较高的学习率,而不必像以前那样迁就小scale的维度;二是归一化后使得更多的权重分界面落在了数据中,降低了overfit的可能性,因此一些防止overfit但会降低速度的方法,例如dropout和权重衰减就可以不使用或者降低其权重。截止到目前,还没有哪个机构宣布重现了论文中的结果,不过归一化的用处在理论层面就已经有了保证,以后也许归一化的形式会有所改变,但逐层的归一化应该会成为一种标准。

Batch Normalization层

标签:fit   机构   论文   权重   orm   因此   改变   作用   用处   

原文地址:https://www.cnblogs.com/llfctt/p/9037604.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!