码迷,mamicode.com
首页 > 其他好文 > 详细

caffe源码 理解链式法则

时间:2017-10-06 00:24:33      阅读:207      评论:0      收藏:0      [点我收藏+]

标签:data-   logs   训练   源码   png   nbsp   sig   image   dsa   

网络结构

首先我们抽象理解下一个网络结构是怎样的,如下图所示

  • F1,F2,F3为某种函数
  • input为输入数据,output为输出数据
  • X1,X2为为中间的层的输入输出数据
技术分享

 

总体来说有以下关系

  • X1 = F(input)
  • X2 = F1(X1)
  • output = F2(X2)

在训练过程中output其实就是loss层的输出,训练的目的就是为了把loss值降到最低

链式法则

  • 链式法则(英文chain rule)即是微积分中的求导法则,用于求一个复合函数的导数,是在微积分的求导运算中一种常用的方法。
  • 表达式: 技术分享
  • 其他形式:技术分享

     

链式法则用文字描述,就是“由两个函数凑起来的复合函数,其导数等于里边函数代入外边函数的值之导数,乘以里边函数的导数。

梯度计算

  • 假设要求output对X1的梯度
    • 由output = F2(F1(X1)),根据链式法则,output对X1的梯度为技术分享

       

  • 假设F(x)= wx + b,相求output对w和b的梯度
    • 则output对w的梯度为技术分享

       

    • 则output对w的梯度为技术分享

       

caffe源码 理解链式法则

标签:data-   logs   训练   源码   png   nbsp   sig   image   dsa   

原文地址:http://www.cnblogs.com/ERKE/p/7630311.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!