码迷,mamicode.com
首页 > 其他好文 > 详细

cs231n---卷积网络可视化

时间:2018-02-02 11:36:25      阅读:193      评论:0      收藏:0      [点我收藏+]

标签:研究   含义   rem   nbsp   工作   线性   --   风格   选择   

本课介绍了近年来人们对理解卷积网络这个“黑盒子”所做的一些可视化工作,以及deepdream和风格迁移。

 

1 卷积网络可视化

(1)可视化第一层的滤波器

 我们把卷积网络的第一层滤波器权重进行可视化(权重值缩放到0~255之间)可以发现:

技术分享图片

第一层的滤波器可以看做模版匹配,那么它寻找的模式就是一些边和线。也就是说,当滤波器滑动到边和线的时候,会有较大的激活值。这跟人脑的功能几乎是一致的。

然而,我们只能可视化第一层滤波器得到如此有意义的结论,可视化后面的滤波器,我们将无法看到什么有用的东西。

(2)研究最后一层

这里的最后一层指的是在输入到最后的得分之前的那一层。

最近邻

技术分享图片

左图是我们在像素空间上求最近邻的结果,右图是我们在最后一层产生的特征向量空间上求最近邻的结果。可以看到右边的有些结果,虽然在像素上大有不同,但是却有相同的语义含义。说明卷积网络处理后的特征向量确实包含着语义信息。

t-SNE降维后可视化

还有一种方法是对最后一层产生的特征向量做t-SNE降维(一种非线性降维方法),降到两维。然后在二维坐标系中将这些图片的位置标识出来。具体结果可以看这里:

http://cs.stanford.edu/people/karpathy/cnnembed/ 

 

(3)可视化激活层

有一些研究可视化了中间的激活层(featureMap):

技术分享图片

大部分的激活好像都不能看到什么东西,有一个激活很明显的与人脸对应。

 

(4)产生最大激活值的图片碎片

我们从每层当中选择一个深度切片,然后在CNN上前向传播大量的图片,观察这些深度切片上的神经元的激活值。对每一张图片来说,选取深度切面上激活值最大的那个神经元,并截取这个神经元所能看到的图片区域。然后按照激活值的大小对这些图片区域进行排序。

技术分享图片 

上图中,每一行表示每一个深度切面的排序结果,可以看到一个深度切面确实是在寻找一种相同的模式。并且,高层所寻找的是一种更大的图片结构,这是因为高层的神经元具有更大的感受野。

 

 

 

 

cs231n---卷积网络可视化

标签:研究   含义   rem   nbsp   工作   线性   --   风格   选择   

原文地址:https://www.cnblogs.com/coldyan/p/8403506.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!