码迷,mamicode.com
首页 > 其他好文 > 详细

Deeplift 论文阅读

时间:2020-03-07 19:14:51      阅读:905      评论:0      收藏:0      [点我收藏+]

标签:src   mic   alt   就是   没有   font   技术   from   ref   

DeepLift是基于反向传播的特征打分算法

目前已有的反向传播算法或基于扰动的打分算法会遇到一个问题

就是在经过Relu激活函数的时候梯度会变为0,但是此特征不一定是无用特征。

情况如下:

技术图片

 

可以看见i1,i2都是有效特征,但是在i1+i2大于0的时候,他们的导数会变为0从而导致打分出错。

 

论文中提出了一个非常有意思的解决方案。

t表示此网络中我们关心的某个神经元,t0表示神经元t被激活的阈值,x1,x2,,,,xn表示要得到t必须要经过的下一层神经元。

那么detal_t = t - t0

detla_x 表示在神经元x处的激活量

技术图片

 

 

 difference-from-reference = 技术图片

得分表示为Cxi detla_t 此得分满足以下条件

 技术图片

 

 

这样的话,即使技术图片 = 0,我们的 技术图片也不为0.

技术图片

 

 这个也是很容易理解的。

因为偏导数就是 y的变化量/ x的变化量, 同理我的变化量也应该是c的变化量/x 的变化量

 

链式法则:

假设输入为xi, 隐藏层为yi, 输出为t 那么链式法则为:

技术图片

也是做乘法,没啥东西

 

对于一些层的阈值计算:

对于函数技术图片y的阈值可以通过如下的式子来计算。

 

技术图片

 

因为最后的输出层可能没有阈值,他们的阈值就要通过这种方法来计算

 

Deeplift 论文阅读

标签:src   mic   alt   就是   没有   font   技术   from   ref   

原文地址:https://www.cnblogs.com/shensobaolibin/p/12436122.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!