Deeplift 论文阅读

时间：2020-03-07 19:14:51 阅读：905 评论：0 收藏：0 [点我收藏+]

DeepLift是基于反向传播的特征打分算法

目前已有的反向传播算法或基于扰动的打分算法会遇到一个问题

就是在经过Relu激活函数的时候梯度会变为0，但是此特征不一定是无用特征。

情况如下:

技术图片

可以看见i1，i2都是有效特征，但是在i1+i2大于0的时候，他们的导数会变为0从而导致打分出错。

论文中提出了一个非常有意思的解决方案。

t表示此网络中我们关心的某个神经元，t0表示神经元t被激活的阈值，x1，x2，，，，xn表示要得到t必须要经过的下一层神经元。

那么detal_t = t - t0

detla_x 表示在神经元x处的激活量

技术图片

difference-from-reference = 技术图片

得分表示为Cxi detla_t 此得分满足以下条件

技术图片

这样的话，即使技术图片 = 0，我们的也不为0.

技术图片

这个也是很容易理解的。

因为偏导数就是 y的变化量/ x的变化量，同理我的变化量也应该是c的变化量/x 的变化量

链式法则:

假设输入为xi，隐藏层为yi，输出为t 那么链式法则为:

技术图片

也是做乘法，没啥东西

对于一些层的阈值计算:

对于函数技术图片 y的阈值可以通过如下的式子来计算。

技术图片

因为最后的输出层可能没有阈值，他们的阈值就要通过这种方法来计算

原文地址：https://www.cnblogs.com/shensobaolibin/p/12436122.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行