快速压缩跟踪（CT）算法剖析

时间：2015-03-20 14:32:24 阅读：6040 评论：0 收藏：0 [点我收藏+]

Fast Compressive Tracking

（快速压缩跟踪）

虽然目前有很多种的跟踪算法，但是由于姿态的变化、光照的变化、障碍物等原因的存在，导致很多算法的鲁棒性不好。

目前比较主流的跟踪算法有两种，generative tracking algorithms（生成跟踪算法）和discriminative algorithms（判别跟踪算法）。

生成跟踪算法，顾名思义边生成边跟踪。即对这一帧的样本进行学习，将学习的结果作为下一帧的分类器，达到边学习跟踪，边跟踪边学习的效果。这种跟踪算法的缺点是在视频的前几帧，样本量较少，因此大部分的算法要求视频中目标在视频的前面变化不大。如果目标变化较大，会产生漂移现象。

判别算法认为跟踪就是一个二分类器的问题，其目的是要找到一个将目标从背景中区分出的边界。但是这种算法只用了一个正样本和少量的负样本来跟新分类器。当特征模板含有噪声或者位置偏离时，便会出现漂移现象。

作者的算法：

技术分享

作者论文中主要步骤如下：

1、获取目标区域特征

为了获取图像的多尺度特征表达，常常将输入图片与不同空间的高斯滤波器进行卷积。而在实际的运用过程中，高斯滤波器的运算量较大，所以一般采用矩形框代替高斯滤波器。经证明，这种代替不会影响特征检测的性能，而且其还能够极大的加快检测的速度。

对于一个W*H的样本，矩形框的选取方法如下：

这里的w和h分别代表矩形框的的width和height。

将这些矩形框分别和输入图像进行卷积的效果如下：

技术分享

每一个输入图片（W*H）和不同大小的矩形框进行卷积的结果的到的仍旧是一个（W*H）的矩阵，但是为了方便将这些特征进行融合整理，将这个（W*H）的矩阵转换为一个含有（W*H）元素的列向量。而一个输入的样本图片共有（w*h）个卷积结果，将这（w*h）个列向量连接，就变成了一个含有(w*h)2个元素的列向量。这个列向量的长度一般可以达到106~1010。对于如此高维的特征，显然会带来相当大的计算量，故作者找到了一种很好的降维方法。

2、获取稀疏测量矩阵

压缩感知的理论指出，对于一个可压缩的信号，例如原始图片或者视频，一小部分随机生成的线性数据可以最大程度的保留原信号中的显著信息，并且能够从这一小部分随机信号将原信号很好的复现。压缩感知理论中还有一个比较专业的名次来形容前面所说的“可压缩信号”——K-sparse 信号。

有了这个理论作为依托，那么我们就可以先获取目标的复杂高维特征，再用压缩感知的理论将特征进行降维。作者采用的方法就是用稀疏随机测量矩阵（R）将原信号进行降维。显然，对于任意的K-sparse信号，我们都希望这个稀疏矩阵R能够将其中的显著信息提取出来，并且将这个K-sparse信号从高维映射到低维空间。

那么，如何寻找这个稀疏矩阵R，使其能够满足我们的要求。

实际上，要寻找这个稀疏矩阵，必须满足一个性质，即“约束等距性”。

一个典型的满足约束等距性的随机稀疏矩阵就是高斯随机矩阵。