一种基于麦克风阵列的声源定位方法

文档序号:1183721 发布日期:2020-09-22 浏览:16次 >En<

阅读说明:本技术 一种基于麦克风阵列的声源定位方法 (Sound source positioning method based on microphone array ) 是由 陈红武 何流 宋翔 刘陈 章子涵 于 2020-07-08 设计创作,主要内容包括:本发明提供了一种基于麦克风阵列的声源定位方法,依次构建麦克风阵列,构建冗余字典矩阵,从冗余字典矩阵中的匹配原子之和与可忽略的最终残差来表示声音信号;匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号进行信号系数近似分解,将各近似分解后的信号系数线性求和;通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度;根据预估角度得到该方向上的波束。本发明提出了改进型的MP—MUSIC算法,通过预估的声源数从接收到的声音信号中分出噪声空间,用新的噪声空间构造空间谱,寻求空间谱的极值得到DOA的估计值,使得该方法对声源具有更好的指向性,提高声源定位的精度。(The invention provides a sound source positioning method based on a microphone array, which comprises the steps of sequentially constructing the microphone array, constructing a redundant dictionary matrix, and representing sound signals from the sum of matched atoms in the redundant dictionary matrix and a negligible final residual error; the MP-MUSIC algorithm matched with the tracking carries out approximate decomposition on the signal coefficient of the sound signal received by each unit microphone, and linearly sums the signal coefficients after the approximate decomposition; calculating coefficient covariance matrix through characteristic decomposition and decomposing noise space, constructing MP-MUSIC space spectrum, and obtaining the estimated angle of DOA by searching the most value; and obtaining the beam in the direction according to the estimated angle. The invention provides an improved MP-MUSIC algorithm, which separates a noise space from a received sound signal through the estimated number of sound sources, constructs a space spectrum by using a new noise space, and seeks an extreme value of the space spectrum to obtain an estimated value of DOA (direction of arrival), so that the method has better directivity to the sound source and improves the precision of sound source positioning.)

一种基于麦克风阵列的声源定位方法

技术领域

本发明涉及语音信号检测与处理技术领域,尤其涉及一种基于麦克风阵列的声源定位方法。

背景技术

语音采集是语音信号处理的重要环节,基于麦克风阵列波束形成的声源定位技术是提高语音采集性能的有效手段,近年来成为信号处理的研究热点。由于声源位置的移动、声音的反射和衍射、外界背景噪声变化等因素的存在,导致对声源定位、信源数目估计困难。人们对基于特征分解的超分辨率空间谱估计算法进行了广泛深入的研究,并提出了一系列高效的处理方法,其中比较经典的是MUSIC算法。MUSIC算法是多重信号分类的英文缩写,该算法利用了信号空间与噪声空间正交性这一远离,构造空间谱函数进行搜索定位,预估语音信号的波达方向DOA。

传统的MUSIC算法研究的范围比较窄,仅仅只限于不是相关的信号,因此当信号源是相关信号或者是比较小的信号噪声比的信号时,MUSIC算法的DOA性能会下降恶化,甚至完全失效,导致不能对语音信号的声源定位准确度和信源数进行可靠估算。

发明内容

有鉴于此,本发明提出了一种对MUSIC算法进行了改进、提高了声源定位精确度的基于麦克风阵列的声源定位方法。

本发明提供了一种基于麦克风阵列的声源定位方法,包括如下步骤:

S100:构建麦克风阵列,将M个单元麦构成麦克风阵列,组成麦克风阵列的各单元麦分别收到的声音信号为x(t);

S200:构建冗余字典矩阵D,冗余字典矩阵D由单位规范原子组成;

S300:从冗余字典矩阵D中选择一个与声音信号x(t)最相似的原子,并求解残差信号,并继续在冗余字典矩阵D中寻找与上一步残差信号最相似的原子,如此重复操作,用迭代的各原子之和与可忽略的最终残差来表示声音信号x(t),得到各单元麦接收到的声音信号x(t)对应的分解系数cl和选定原子gl

S400:匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号x(t)进行信号系数近似分解,将各近似分解后的信号系数线性求和;

S500:通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度θ,即预估的声源的来波方向角;

根据预估的声源的来波方向角θ得到加权矢量W(θ),再由加权矢量W(θ)得到θ方向上的波束,通过波束成形对声源进行定位跟踪和噪声抑制;波束表示为:

y(t)=WH(θ)x(t)=aH(θ)x(t);

PBF=WH(θ)RW(θ)=aH(θ)Ra(θ);

y(t)为麦克风阵列的输出;R为麦克风阵列的各单元麦分别接收到的声音信号x(t)的协方差矩阵;PBF为波束的输出功率。

在以上技术方案的基础上,优选的,所述从冗余字典矩阵D中迭代求解声音信号x(t)对应的分解系数cl和选定原子gl的方法为:令x[l]=x(t);l为迭代次数,初值为1;迭代找出gl∈D使得|<x[l],gl>|的内积最大;定义cl=|<x[l],gl>|,x[l+1]=x[l]-cl·gl,重复迭代过程;当最终残差可以忽略时或者达到最大迭代次数L时,停止迭代,得到对应的分解系数cl和选定原子gl;x[l]和x[l+1]均为当前和下一次迭代的信号残差。

进一步优选的,所述将各近似分解后的信号系数线性求和的方法为:对得到麦克风阵列的第一个单元麦输出的信号系数x1近似分解为:

其中L为最大迭代次数;是信号系数;

Figure BDA0002574706400000023

是对应的噪声系数;

对第二个到第M个麦克风输出信号系数xm近似分解为:

m=2,3,4…M;

Figure BDA0002574706400000032

是信号系数;是对应的噪声系数;

将上述步骤的M个麦克风输出信号线性求和,并提取导向矢量,改写成:

X为麦克风的接收信号矩阵;A为导向矢量构成的矩阵;

Figure BDA0002574706400000035

为MP系数,G为冗余字典矩阵D中与麦克风输出信号相关性最高的原子;为噪声矩阵;原子G不包含DOA信息,上式改写为:

Figure BDA0002574706400000037

C是M×L阶的MP系数分解矩阵。

更进一步优选的,步骤S500通过寻找最值来获得DOA的估计的角度θ,是求解MP—MUSIC空间谱PMP-MUSIC的分母的极小值:

其中,为通过协差矩阵RCC=CCH的特值分解得到的噪声空间MP系数;CH是MP系数分解矩阵C的共轭转秩矩阵;的共轭转秩矩阵;a(θ)是声源的导向向量,等同于A;aH(θ)为a(θ)的共轭转秩矩阵;PMP-MUSIC为MP—MUSIC空间谱;假定有d个声源信号,a(θ)=[a(θ1),a(θ2),…a(θd)];导向向量a(θ)中的元素对应的是各声源对应的导向向量,第k列a(θk)表示第k个声源的导向向量:θk表示第k个声源的来波方向角;k=1,2,…d;

Figure BDA00025747064000000312

λ是声源波长;声音信号x(t)的协方差矩阵R进行特值分解,将协方差矩阵R的特值进行降序排列,按顺序排列的前d个特值对应于d个声源信号;剩余的M—d个特值对应噪声信号。

在以上技术方案的基础上,优选的,所述麦克风阵列为线性麦克风阵列;各单元麦呈直线排列且间隔相等。

在以上技术方案的基础上,优选的,所述麦克风阵列为圆形麦克风阵列;各单元麦均匀分布在一个同心圆上。

本发明提供的一种基于麦克风阵列的声源定位方法,相对于现有技术,具有以下有益效果:

(1)本发明提出了改进型的MP—MUSIC算法,通过预估的声源数从接收到的声音信号中分出噪声空间,用新的噪声空间构造空间谱,寻求空间谱的极值得到DOA的估计值,使得该方法对声源具有更好的指向性,提高声源定位的精度;

(2)改进型的MP—MUSIC算法通过波束成形对声源进行定位跟踪和噪声抑制,波束形成可以对声源进行实时定位,并抑制背景噪声的干扰;传统的波束成形是采用扫描形式定位,需要对每个角度进行判断,计算量大,耗时长;本发明的定位方法能更快速的定位;

(3)本发明采用匹配跟踪的思想,在冗余字典中寻找与输入声音信号最相似的原子,形成一个可替代性的逼近,并求出残差信号,反复迭代和逼近,信号可由多个原子的线性和表示;

(4)本发明对与声源相似的噪音具有较好的区分能力,较精准的预估声源信号的方向角;

(5)根据需要可以采用不同结构的麦克风阵列,分别对面波声源或者空间声源获取更好的定位效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种基于麦克风阵列的声源定位方法的原理图;

图2为本发明一种基于麦克风阵列的声源定位方法的波束成形的原理图;

图3为本发明一种基于麦克风阵列的声源定位方法的声源定位效果示意图;

图4为本发明一种基于麦克风阵列的声源定位方法的环境模拟仿真实验对比图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1结合图2所示,本发明提供了一种基于麦克风阵列的声源定位方法,包括如下步骤:

S100:构建麦克风阵列,将M个单元麦构成麦克风阵列,组成麦克风阵列的各单元麦分别收到的声音信号为x(t);

S200:构建冗余字典矩阵D,冗余字典矩阵D由原子组成;本发明的冗余字典矩阵D为非相干字典;

S300:从冗余字典矩阵D中选择一个与声音信号x(t)最相似的原子,并求解残差信号,并继续在冗余字典矩阵D中寻找与上一步残差信号最相似的原子,如此重复操作,用迭代的各原子之和与可忽略的最终残差来表示声音信号x(t),得到各单元麦接收到的声音信号x(t)对应的分解系数cl和选定原子gl;具体方法为:令x[l]=x(t);l为迭代次数,初值为1;迭代找出gl∈D使得|<x[l],gl>|的内积最大;定义cl=|<x[l],gl>|,x[l+1]=x[l]-cl·gl,重复迭代过程;当最终残差可以忽略时或者达到最大迭代次数L时,停止迭代,得到对应的分解系数cl和选定原子gl;x[l]和x[l+1]均为当前和下一次迭代的信号残差,依次类推;

S400:匹配跟踪的MP—MUSIC算法,将各单元麦接收到的声音信号x(t)进行信号系数近似分解,将各近似分解后的信号系数线性求和,具体方法为:

对得到麦克风阵列的第一个单元麦输出的信号系数x1近似分解为:

Figure BDA0002574706400000061

其中L为最大迭代次数;是信号系数;是对应的噪声系数;

对第二个到第M个麦克风输出信号系数xm近似分解为:

Figure BDA0002574706400000064

m=2,3,4…M;是信号系数;

Figure BDA0002574706400000066

是对应的噪声系数;

将上述步骤的M个麦克风输出信号线性求和,并提取导向矢量,改写成:

Figure BDA0002574706400000067

X为麦克风的接收信号矩阵;A为导向矢量构成的矩阵;为MP系数,G为冗余字典矩阵D中与麦克风输出信号相关性最高的原子;为噪声矩阵;原子G不包含DOA信息,上式改写为:

C是M×L阶的MP系数分解矩阵。

S500:通过特征分解计算系数协差矩阵并分解噪声空间,构造MP—MUSIC空间谱,通过寻找最值来获得DOA的估计的角度θ,即预估的声源的来波方向角;

根据预估的声源的来波方向角θ得到加权矢量W(θ),再由加权矢量W(θ)得到θ方向上的波束,通过波束成形对声源进行定位跟踪和噪声抑制;波束表示为:

y(t)=WH(θ)x(t)=aH(θ)x(t);

PBF=WH(θ)RW(θ)=aH(θ)Ra(θ);

y(t)为麦克风阵列的输出;R为麦克风阵列的各单元麦分别接收到的声音信号x(t)的协方差矩阵;PBF为波束的输出功率。

具体方法为:构建MP—MUSIC空间谱PMP-MUSIC

Figure BDA00025747064000000611

并求解分母的最小值对应的a(θ);即PMP-MUSIC的峰值;

其中,

Figure BDA0002574706400000071

为通过协差矩阵RCC=CCH的特值分解得到的噪声空间MP系数;CH是MP系数分解矩阵C的共轭转秩矩阵;的共轭转秩矩阵;a(θ)是声源的导向向量,等同于A;aH(θ)为a(θ)的共轭转秩矩阵;PMP-MUSIC为MP—MUSIC空间谱;假定有d个声源信号,a(θ)=[a(θ1),a(θ2),…a(θd)];导向向量a(θ)中的元素对应的是各声源对应的导向向量,第k列a(θk)表示第k个声源的导向向量:θk表示第k个声源的来波方向角;k=1,2,…d;

λ是声源波长;声音信号x(t)的协方差矩阵R进行特值分解,将协方差矩阵R的特值进行降序排列,按顺序排列的前d个特值对应于d个声源信号;剩余的M—d个特值对应噪声信号。

MUSIC算法是空间谱估计技术的一种算法,其利用协差矩阵将特值进行分解,通常将空间信号分为信号特征向量对应的信号空间,以及噪音向量对应的噪声空间,利用噪声空间与信号空间正交性质原理,构造空间谱函数并进行搜索,但是这种算法处理的信号范围比较窄,而且只能处理不相关的信号,适用范围很有限。本发明是在MUSIC的算法基础上进行了优化,利用匹配跟踪MP的思想,进行信号的原子逼近。

本发明中构造的的麦克风阵列为线性麦克风阵列,也可以采用圆形麦克风阵列;采用线性阵列布置时,各单元麦呈直线排列且间隔相等;采用圆形麦克风阵列布置时,各单元麦均匀分布在一个同心圆上。

图3表示了当入射声波为20°和60°时,信噪比为5dB时的试验结果,试验采用MATLAB仿真实现。图(a)采用传统MUSIC算法,图(b)采用本发明声源定位方法,可以看出,对于相似信号,传统的MUSIC算法识别能力较差,但是本发明声源定位方法采用MP—MUSIC算法可以去除相似的信号,比较精确的估算DOA。

图4为在房间中模拟本发明的声源定位方法的效果对比。声源入射角为0,噪声会通过墙壁不断反射进而干扰有效声源信号,麦克风阵列处于不可控的环境中,在模拟环境中,传统MUSIC算法与本发明声源定位方法的MP—MUSIC算法的声源指向性定位基本一致,但是对于噪音的抑制,传统MUSIC算法的抑制效果比较差。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于射频片上系统RFSOC的小型捷变频相控阵雷达

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!