码迷,mamicode.com
首页 > Web开发 > 详细

论文: Deformable Convolutional Networks

时间:2017-08-14 20:14:54      阅读:394      评论:0      收藏:0      [点我收藏+]

标签:enter   font   主动学习   版本   解决   form   layer   data   net   

论文: Deformable Convolutional Networks

 

 

CNN因为其内部的固定的网络结构,对模型几何变换的识别非常有限。

 

本paper给出了两个模块deformable convolution 和 deformable ROI-Pooling来提高CNN的模型变换能力。

技术分享

 

过去的办法解决几何变换的方法,一,使用data Augmentation来增大不同几何形状的object,二,使用sift 或者 sliding windows这样的方法来解决。

 

本paper主要针对三个module进行了deformable的改进,deformable Convolution, deformable ROI-Pooling 和 deformable PSROI-Pooling 

这里主要讲 conv layer 的 deformable Conv 版本。

技术分享

 

 

 

本paper是使用公式

技术分享

 针对p0点的像素点,使用Pn是之前conv的方法,添加了^P 来作为offset,其中^P是一个非常小的量。 而这个offset是由

技术分享

得到的,G(. , .) 是 bilinear interpolation kernel。

 

在训练中,同时对conv kernel和offsets进行学习。
其中,该deformable conv kernel的求导为:
技术分享

 

 


这paper的目的是augmentating空间样本点和RoI-pooling得到额外的offset量,同时在learning 中学习到offset量。

 

本人观点:

利用deformable offset 来学习每一个 pixel 的偏移量,从而主动学习到object的region。改变了过去方方正正的 object region,可以learn到deformable的region。

 

论文: Deformable Convolutional Networks

标签:enter   font   主动学习   版本   解决   form   layer   data   net   

原文地址:http://www.cnblogs.com/zhang-yd/p/7359546.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!