码迷,mamicode.com
首页 > 其他好文 > 详细

CNN Tomography With Caffe - Full Connected Layer

时间:2016-07-10 09:54:36      阅读:239      评论:0      收藏:0      [点我收藏+]

标签:

AlexNet Diagram

技术分享 

技术分享

Deduction

全连接结构中的符号定义如下图:

技术分享

技术分享

Forward Propagation

技术分享       

 

Backward Propagation 

Follow Chain Rule, define loss function技术分享技术分享, so we have:

 技术分享

Here we define技术分享技术分享,下面分别介绍这两个偏导项如何计算。

计算技术分享

Now we firstly get output layer技术分享. As an example, we take cross entropy as loss function, with SoftMax as output function.

技术分享

技术分享 

继续由技术分享技术分享技术分享有:

技术分享 

还是 Chain Rule, 这个chain rule决定了BP是个递推过程。

技术分享 

So

技术分享 

技术分享的求解过程是是个从后往前的递推过程。

 

计算技术分享

技术分享的求解比较简单。
由于:

技术分享 

技术分享 

 

Caffe Practice技术分享

技术分享 

Forward Propagation

bottom节点数技术分享技术分享, top节点数技术分享技术分享, batch数技术分享技术分享。则bottom矩阵为技术分享技术分享,top矩阵为技术分享技术分享,weight 矩阵技术分享技术分享, bias为技术分享技术分享, bias weight为技术分享技术分享。下图给出了这几个关键量在Caffe中的存在形式:

技术分享 

技术分享
数学形式为:

技术分享 

Backward Propagation

后向还是分两部分算,一部分是计算技术分享技术分享; 一部分是计算bottom_diff = 技术分享,以作为下一层的top_diff, 这里技术分享实际上就是技术分享, 因此bottom_diff = 技术分享技术分享。下图给出Caffe计算后向传播时的几个关键量。

技术分享 

技术分享

计算技术分享

 技术分享

则有下面的实现:

技术分享 

 

计算bottom_diff

技术分享 

即:

技术分享 

CNN Tomography With Caffe - Full Connected Layer

标签:

原文地址:http://www.cnblogs.com/Matrix_Yao/p/5657116.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!