标签:网络 max 概率 中间 问题 解释 class text softmax
(1)对于深度神经网络,中间的隐层的输出必须有一个激活函数。否则多个隐层的作用和没有隐层相同。这个激活函数不一定是sigmoid,常见的有sigmoid、tanh、relu等。
(2)对于二分类问题,输出层是sigmoid函数。这是因为sigmoid函数可以把实数域光滑的映射到[0,1]空间。函数值恰好可以解释为属于正类的概率(概率的取值范围是0~1)。另外,sigmoid函数单调递增,连续可导,导数形式非常简单,是一个比较合适的函数
(3)对于多分类问题,输出层就必须是softmax函数了。softmax函数是sigmoid函数的推广
神经网络为什么要用sigmoid函数?为什么要映射到0-1之间?
标签:网络 max 概率 中间 问题 解释 class text softmax
原文地址:http://www.cnblogs.com/misszhu-home/p/6057095.html