标签:title none details 结果 relevant ack sim 通过 markdown
我们认为上述不合理的设计是由图片分类中増长的平移不变性与目标检测中的平移变换性之间的矛盾引起的。一方面,图像级别的分类任务侧重于平移不变性(在一幅图片中平移一个物体而不改变它的判别结果),因此深度全卷积网络结构在尽可能保持平移不变性是最好的,通过在 ImageNet classification上的良好表现得以证明
另一方面,目标检测任务需要位置表示,从某种程度上说是平移可变换的(translation-variant)。例如,平移一个候选框里的物体应该产生一个有意义的反馈,用来描述候选框和物体的重叠程度。我们假定在图片分类网络中,卷积层越深,对平移越不敏感。为了解决这个两难境地(图片分类中的平移不变性和目标检测中的平移变换性),在 ResNet文献[]中的检测算法中插入了 ROI pooling layer到卷积层——这个区域特异性操作破坏了平移不变性,而且当评估不同区域时,post-Rol卷积层不再是平移不变的了。然而这种设计牺牲了训练和测试的效率,因为它引入了大量的 region-wise layers
这是这是因为有一些roi是相似的,就有一些重复的roi在后续计算中重复计算
标签:title none details 结果 relevant ack sim 通过 markdown
原文地址:https://www.cnblogs.com/lishikai/p/12424132.html