码迷,mamicode.com
首页 > 编程语言 > 详细

反向传播算法推导

时间:2019-02-23 10:55:49      阅读:263      评论:0      收藏:0      [点我收藏+]

标签:使用   tps   推导   图片   log   解决   cal   char   向量   

技术图片

 

一、MSE 损失函数推导

前向传播过程:

技术图片

 

梯度反向传播公式推导:

定义残差:技术图片

技术图片

 

残差推导如下:

对于最后一层:

技术图片

 

广义上,左边项(-(···))是定义的损失函数对其输入(即最后一层神经元值)的导数,右项是sigmoind求导,这两项都是根据实际使用可以替换的。

 

对于隐藏层:

技术图片

 

 

若去掉下标i,则有

技术图片

其中技术图片的操作是把两个向量对应元素相乘组成新的元素。

 

 参考:

https://www.cnblogs.com/nowgood/p/backprop2.html

https://zhuanlan.zhihu.com/p/25416673

 

 二、交叉熵损失函数推导

只放出最后一层残差:

技术图片

技术图片

参考:https://blog.csdn.net/Charel_CHEN/article/details/81266838

 

 三、二元交叉熵损失梯度推导

技术图片

参考:https://blog.csdn.net/chansonzhang/article/details/84674144

 

四、L2正则化以及反向传播

技术图片

参考:https://blog.csdn.net/obrightlamp/article/details/85290929

 

五、CNN反向传播算法总结

技术图片

技术图片

 

 注释:CNN反向传播主要解决四个问题

技术图片

一二问对应步骤d-3,三问对应步骤d-2,四问对应步骤2-2-2.

具体推导细节请移步:https://www.cnblogs.com/pinard/p/6494810.html

反向传播算法推导

标签:使用   tps   推导   图片   log   解决   cal   char   向量   

原文地址:https://www.cnblogs.com/CJT-blog/p/10419523.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!