标签:深度网络 大小 自动 慢慢 mgr one logs sgd log
训练过程中需要适时的调整参数,以获得比较好的模型,下面介绍几种调参方式:
权重初始化太大容易发散,初始化太小容易弥散而不收敛,Xavier是让权重均值为0,方差为2/in+out,可以初始化的不大不小
具体例子可以参考:http://www.cnblogs.com/xuanyuyt/p/6062204.html
标签:深度网络 大小 自动 慢慢 mgr one logs sgd log
原文地址:https://www.cnblogs.com/lightsun/p/9489448.html