标签:训练 输入 nat 大小 固定 坐标 转化 concat 特征提取
roi pooling是先进行roi projection(即映射)然后再池化
映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单,图片经过特征提取后,到最后一层卷积层时,真个图片是原始图片的1/16,你把roi的4个坐标都乘以1/16,也就变成了在这个卷积层上对应的坐标。这和我当时把1920x1200图片转化为960x600进行的gt-roi变换是一样的。
得到roi在最后一层卷积层的坐标后,就把这个roi区域均分成HxW份,每份进行池化,最后再把这么多份concatenate起来输入给下一层。这样所有roi,不论roi大小,生成的都是固定长度的一个向量给下一层。
标签:训练 输入 nat 大小 固定 坐标 转化 concat 特征提取
原文地址:http://www.cnblogs.com/ymjyqsx/p/7587051.html