反向传播算法推导

时间：2019-02-23 10:55:49 阅读：263 评论：0 收藏：0 [点我收藏+]

技术图片

一、MSE 损失函数推导

前向传播过程：

技术图片

梯度反向传播公式推导：

定义残差：

则

技术图片

残差推导如下：

对于最后一层：

广义上，左边项（-（···））是定义的损失函数对其输入（即最后一层神经元值）的导数，右项是sigmoind求导，这两项都是根据实际使用可以替换的。

对于隐藏层：

若去掉下标i，则有

其中 $技术图片$ 的操作是把两个向量对应元素相乘组成新的元素。

参考：

https://www.cnblogs.com/nowgood/p/backprop2.html

https://zhuanlan.zhihu.com/p/25416673

二、交叉熵损失函数推导

只放出最后一层残差：

技术图片

参考：https://blog.csdn.net/Charel_CHEN/article/details/81266838

三、二元交叉熵损失梯度推导

技术图片

参考：https://blog.csdn.net/chansonzhang/article/details/84674144

四、L2正则化以及反向传播

技术图片

参考：https://blog.csdn.net/obrightlamp/article/details/85290929

五、CNN反向传播算法总结

技术图片

注释：CNN反向传播主要解决四个问题

技术图片

一二问对应步骤d-3，三问对应步骤d-2，四问对应步骤2-2-2.

具体推导细节请移步：https://www.cnblogs.com/pinard/p/6494810.html

原文地址：https://www.cnblogs.com/CJT-blog/p/10419523.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行