论文笔记之：Visual Tracking with Fully Convolutional Networks

时间：2016-07-04 20:33:31 阅读：312 评论：0 收藏：0 [点我收藏+]

标签：

ICCV 2015 CUHK

　　本文利用 FCN 来做跟踪问题，但开篇就提到并非将其看做是一个黑匣子，只是用来提取特征，而是在大量的图像和 ImageNet 分类任务上关于 CNN 的 feature 做了大量的深度的研究。这些发现促使他们设计了该跟踪系统，他们发现：不同的卷积层会从不同的角度来刻画目标。顶层的 layer 编码了更多的关于语义特征并且可以作为种类检测器，而底层的层懈怠了更多的具有判别性的信息，并且可以更好的区分具有相似外观的目标。在跟踪的过程中利用这两种层的不断切换而完成跟踪。作者还发现，对于一个跟踪目标，仅仅一些神经元是与其有关的，于是提出了一种 feature map 选择机制来移除噪声和不相关的 feature maps，可以减少计算量，并且提升了跟踪的效果。在tracking benchmark 上取得了 state-of-the-art 的效果，具体是如何屌的，让我们进一步的看。

　　Introduction：

　　视觉跟踪领域仍然有许多未能很好解决的问题，像：明显的外观改变，姿态的改变，严重的遮挡，以及复杂背景等等。虽然传统方法利用手工设计的方法也研发了许多经典的跟踪算法，但是随着 CNN 的出现，跟踪领域也逐渐被深度学习方面的技术所占领，主要就是因为 CNN 可以得到更好的 feature 表达，这从很大的程度上超越了传统方法，可以看到最近的深度方面的方法基本都将 tracking 的 benchmark 刷到了 90+% 的精度，但是这些方法基本都是在海量数据上先预训练，然后 transfer 到跟踪问题上。因为跟踪问题，只是提供第一帧的 bounding box 使得深度的海量数据训练的方法有些受困。但是，纯粹的利用 CNN 强大的特征表达能力，并不能说跟踪技术发展的有多快，更加只能的算法还有待开发出来。更多的人只是将 CNN 看作是一个黑匣子，这也是本文一直在强调的，那么本文是怎么做的呢？

　　本文分析了各个层的特征对跟踪的影响，更加合理的选择特征来做到减少计算量的同时，提升跟踪性能。本文发现了两个有意思的属性，即：

　　1. 不同的层次 feature 对跟踪问题的影响不同，具体表现在：

　　　　（1）顶层的 CNN 提出的 feature 具有较好的抽象和高层语义特征。这些特征对于区分不同的类别，或者对付形变和遮挡具有更好的鲁棒性。

　　　　（2）底层的特征提供了更多的细节的局部信息，可以更好的区分外观类似的目标。

　　这些方面的具体表现如下图所示：

技术分享

论文笔记之：Visual Tracking with Fully Convolutional Networks

标签：

原文地址：http://www.cnblogs.com/wangxiaocvpr/p/5641535.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行