码迷,mamicode.com
首页 > 其他好文 > 详细

人工智能领域中声源定位的研究与发展------第二章 声源定位系统 (3)

时间:2015-06-12 14:56:22      阅读:194      评论:0      收藏:0      [点我收藏+]

标签:人工智能   声源定位   

2.2.3 基于最大输出功率的可控波束形成技术

该方法对麦克风所接收到的声源信号滤波并加权求和来形成波束,进而通过搜索声源可能的位置来引导波束,修改权值使传声器阵列的输出信号功率达到最大,波束输出功率最大的点就是声源的位置。传统的波束形成器的权值取决于各阵元上信号的相位延迟,而相位又与时延和声源到达延迟(DOA)有关,故又称为时延求和波束形成器。而现代的波束形成器则突破了上述局限,在进行时间校正的同时还对信号进行滤波,称为滤波求和波束形成器。

可控波束形成技术本质上是一种最大似然估计,它需要声源和环境噪声的先验知识。在实际使用中,这种先验知识往往很难获得。此外,最大似然估计是一个非线性最优化问题,这类目标函数往往有多个极点,且该方法对初始点的选取也很敏感。因此,使用传统的梯度下降算法往往容易局限于极小点,从而不能找到全局最优点。若要通过其他搜索方法找到全局最优点,就会极大地增加复杂度。

基于可控波束形成的定位算法,主要分为延迟累加波束算法和自适应波束算法。前者运算量较小,信号失真小,但抗噪性能差,需要较多的阵元才有比较好的效果,后者因为加了自适应滤波,所以运算量比较大,而且输出信号有一定程度的失真,但需要的麦克风数目相对较少,在没有混响时有比较好的效果。

波束形成技术已经广泛应用于基于麦克风阵列的语音拾取领域,但要达到稳健有效的声援定位还十分困难。这主要是由于该方法需要进行全局搜索,运算量极大,很难实时实现。虽然可以采用一些迭代方法来减少运算量,但常常没有有效的全局峰值,收敛于几个局部最大值,且对初始搜索值极度敏感。并且,可控波束定位技术依赖于声源信号的频率特性,其最优化准则绝大多数都基于背景噪声和声源信号的频域特性,其最优化准则绝大多数都基于背景噪声和声源信号的频谱特性的先验知识。因此,该类方法在实际系统中性能差异很大,再加之计算复杂度高,限制了该类算法的应用范围。

基于最大输出功率的可控波束形成技术知识要点直观图如下:
技术分享

图2-5 基于最大输出功率的可控波束形成技术知识要点直观图


本质:最大似然估计(非线性最优化:存在多个极点同时初始点的选取可能导致只是局部最优点而不是全局最优点)

所需:先验知识(不好获得)

2.2.3.1 典型可控定位算法介绍

1.延迟累加波束算法

技术分享

图2-6 延迟累加波束算法系统图

通过延时控制补偿从声源到每个麦克风的延时,对每个麦克风接收到的信号进行校正。然后,使麦克风阵列波束指向有最大输出功率的方向,即波束对准相应空间位置的声源信号同时削弱噪声和混响的影响。

延时累加算法可以分为三部分:时间延迟估计、时间延迟补偿以及累加部分,其系统框图如图2-6所示。图中时间延迟估计与麦克风数目、麦克风间距、声源入射角及采样频率成正比,与声音的传播速度成反比。加权的方法有很多种,最简单的就是平均加权。该系统具有较好的鲁棒性其计算复杂度也较小,但在实际应用中,理论上信噪比的提高与采用麦克风数目的关系为10lgM(M为所采用的麦克风数目),由此欲达到较好指向性和较高信噪比时需要的麦克风数目较多。

2.自适应波束算法

技术分享

图2-7 自适应波束法系统框图

自适应波束法利用的原理是自适应噪声抵消,即以噪声为处理对象将噪声抑制或者进行非常大的衰减以提高接收信号的质量由系统框图2-7可以看到,在自适应噪声干扰抵消器的前端,提供所需的逼近跟踪信号即噪声信号的是一块矩阵的输出运算输出,此输出相当于起了参考信号的作用。这个块矩阵称为标准Griffiths-Jimm块矩阵,其形式为:

技术分享

图2-7中的延迟补偿的信号(即含噪语音)减去块运算输出的模仿噪声信号即得到最小均方误差下目标语音估计信号。

在开放环境条件下,如果噪声源的数目比麦克风数目少,自适应波束法能得到很好的性能。而在封闭环境中由于反射和混响会产生多噪声域的情况,在散射噪声条件下自适应波束法的消噪性能比较有限。

3后置自适应滤波法

技术分享

图2-8 后置自适应滤波系统框图

后置自适应滤波法,其系统框图如图2-8所示。由于单纯的延迟累加方法很难得到理想的语音增强,一般在较复杂的实际噪声情况下采用4个麦克风其信噪比的改善在0.5dB-1dB左右,因此需要进一步的增强方法。1988年Zelinsk提出了在传统的波束输出后采用后置滤波来消除不相关噪声的延迟累加滤波方法,即后置自适应滤波法。在图2-7中可以看出后置自适应滤波法即为在延迟累加波束法的后端加入一个那位滤波的环节,这样虽然是系统结构较为延迟累加法复杂,但却能发挥维纳滤波(最小二乘或最小平方滤波)的优势,达到较好的消噪效果。

这种方法中维纳滤波器的系数是根据各信道接收信号间的自相关和互相关得到,即维纳滤波器的系数是自适应变化的。延迟累加后的含噪语音信号经过维纳滤波后得到最小均方误差准则下的目标语音估计信号。这种方法在不相关噪声的环境下能通过相对较少的麦克风数目获得较好的消噪性能。如在较复杂的实际情况下系统采用4个麦克风时,采用此方法比延迟累加方法能提高4dB-6dB左右,消噪效果十分明显。

延迟-累加波束法和后置自适应滤波法适用于非相干噪声和弱相干噪声消除;而自适应波束法适用于消除相干噪声,对非相干噪声或散射噪声消除效果较差。

人工智能领域中声源定位的研究与发展------第二章 声源定位系统 (3)

标签:人工智能   声源定位   

原文地址:http://blog.csdn.net/jojozhangju/article/details/46470819

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!