图像特征提取：图像的矩特征

时间：2014-09-28 21:41:15 阅读：490 评论：0 收藏：0 [点我收藏+]

标签：des blog http color os 使用 ar strong for

1. 矩的概念

图像识别的一个核心问题是图像的特征提取，简单描述即为用一组简单的数据（图像描述量）来描述整个图像，这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年，不断有新的特征提出，而图像不变矩就是其中一个。

矩是概率与统计中的一个概念，是随机变量的一种数字特征。设

比较重要的有两种情况：

一阶原点矩就是期望。一阶中心矩

针对于一幅图像，我们把像素的坐标看成是一个二维随机变量

不变矩(Invariant Moments)是一处高度浓缩的图像特征，具有平移、灰度、尺度、旋转不变性。M.K.Hu在1961年首先提出了不变矩的概念。1979年M.R.Teague根据正交多项式理论提出了Zernike矩。下面主要介绍这两种矩特征的算法原理与实现。

2. Hu矩

一幅

m p q = \sum i = 1 M \sum j = 1 N i p j q f (i, j)

μ p q = \sum i = 1 M \sum j = 1 N (i - i ¯) p (j - j ¯) q f (

其中

若将

为了消除图像比例变化带来的影响，定义规格化中心矩如下：

η p q = μ p a μ γ 00 , ( γ = p + q 2 , p + q = 2 , 3 , \dots )

利用二阶和三阶规格中心矩可以导出下面7个不变矩组

3. 利用OpenCV计算Hu矩

opencv里对Hu矩的计算有直接的API，它分为了两个函数：moments()函数用于计算中心矩，HuMoments函数用于由中心矩计算Hu矩。

Moments moments(InputArray array, bool binaryImage=false )

参数说明

输入参数：array是一幅单通道，8-bits的图像，或一个二维浮点数组(Point of Point2f)。binaryImage用来指示输出图像是否为一幅二值图像，如果是二值图像，则图像中所有非0像素看作为1进行计算。
输出参数：moments是一个类：

class Moments
{
public:
    Moments();
    Moments(double m00, double m10, double m01, double m20, double m11,
            double m02, double m30, double m21, double m12, double m03 );
    Moments( const CvMoments& moments );
    operator CvMoments() const;

里面保存了图像的2阶与3阶中心矩的值。

void HuMoments(const Moments& moments, double* hu)

参数说明：

输入参数：moments即为上面一个函数计算得到的moments类型。
输出参数：hu是一个含有7个数的数组。

int main(int argc, char** argv)
{
    Mat image = imread(argv[1]);
    cvtColor(image, image, CV_BGR2GRAY);
    Moments mts = moments(image);
    double hu[7];
    HuMoments(mts, hu);
    for (int i=0; i<7; i++)
    {
        cout << log(abs(hu[i])) <<endl;
    }
   return 0;
}

上面代码中，最终输出的值为

我们分别计算一幅图像在，旋转，噪声与模糊时的Hu矩。

类别
原图	-6.76181	-19.1286	-23.7441	-26.776	-51.7618	-35.8491	-51.534
旋转	-6.72102	-19.0844	-23.5756	-25.9122	-51.4619	-35.4595	-50.7674
加放噪点	-6.76086	-19.1255	-23.7611	-26.3228	-51.5056	-35.895	-51.6321
模糊	-6.76183	-19.1295	-23.7451	-26.2767	-51.765	-35.8484	-51.5307

4. Zernike矩

Hu矩在图像描述上有广泛的应用，但是其低阶几何矩与图像整体特征有关，不包含太多的图像细节信息，而高阶几何矩易受噪声影响，因此很难利用几何矩恢复图像。

Zernike矩能够很容易地构造图像的任意高阶矩，并能够使用较少的矩来重建图像。Zernike矩是基于Zernike多项式的正交化函数，虽然其计算比较复杂，但是Zernide矩在图像旋转和低噪声敏感度方面具有较大的优越性。由于Zernike矩具有图像旋转不变性，而且可以构造任意高阶矩，所以被广泛应用对目标进行识别中。

4.1 Zernike矩多项式

首先要弄清楚什么是正交多项式。若函数

对于一个多项式的序列

若

那么正交多项式有什么作用呢？答案是：逼近！正交多项式相当于基，任何一个n维多项式函数

Zernike在1934年提出了在单位圆上定义的一组正交多项式，即Zernike正交多项式，其定义形式为：

R n m (ρ) = \sum s = 0 (n - | m |) / 2 ( - 1 ) s [ ( n -

V n m (x, y) = V n m (ρ, θ) = R n m (ρ) e j m θ

其中

Zernike多项式

R n m (ρ) = [ ( K 2 2 ρ 2 + K 3 ) R ( n - 2 ) m ( ρ ) + K 4 R

R m m (ρ) = ρ m

式中：

4.2 Zernike矩的定义

由于Zernike多项式的正交完备性，所以在单位圆内的任何图像

f (x, y) = \sum n = 0 \infty \sum m = 0 \infty Z n m V n, m (ρ, θ)

上式中的

对二维函数

Z n m = n + 1 π \int 1 0 \int 2 π 0 [ V n m ( ρ , θ ) ] f ( ρ

= n + 1 π ? R n m ( ρ ) e j m θ f ( ρ , θ ) d ρ d θ

式中

4.3 Zernike矩的计算

从Zernike矩的计算公式上来看，对于二维图像，其Zernike矩

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) c o s ( m

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) s i n ( m

因为数字图像是离散形式的点，所以需要将上式离散化，把积分号换为求和号，但是需要作一些坐标变换。

对于

如果

σ = 2 ( r - x ) y | y | + x y r

如果

σ = 2 y - x y r

我们容易计算出，

ρ = 2 r / N, θ = π σ (4 r)

所以，最终我们得到离散化的Zernike矩的计算公式：

C n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

S n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

1. 确定图像的大小

2. 确定

3. 利用Zernike多项式的递推性质计算各阶

4. 对

现在我们用Zernike矩来计算美女图像在4种状态下的值：

类别
原图	11.1732	13.8469	12.3515	12.4391	14.2782	12.6137	11.5745
旋转	12.3036	13.8309	13.5861	12.0467	13.1320	13.8396	12.7862
加放噪点	11.1538	13.8490	12.3315	12.4316	14.2730	12.5925	11.5591
模糊	11.1636	13.8465	12.3480	12.4367	14.2799	12.6130	11.5752