根据deeplearn.ai吴恩达深度学习课程3.11总结
因为如果W初始化为0 则对于任何Xi,每个隐藏层对应的每个神经元的输出都是相同的,这样即使梯度下降训练,无论训练多少次,这些神经元都是对称的,无论隐藏层内有多少个结点,都相当于在训练同一个函数。
标签:隐藏 函数 一个 权重 body 网络 随机 down 深度学习
根据deeplearn.ai吴恩达深度学习课程3.11总结
因为如果W初始化为0 则对于任何Xi,每个隐藏层对应的每个神经元的输出都是相同的,这样即使梯度下降训练,无论训练多少次,这些神经元都是对称的,无论隐藏层内有多少个结点,都相当于在训练同一个函数。
标签:隐藏 函数 一个 权重 body 网络 随机 down 深度学习
原文地址:http://www.cnblogs.com/guoyaohua/p/8053207.html