麦克风阵列降噪方法、装置和电子设备

文档序号:70683 发布日期:2021-10-01 浏览:13次 >En<

阅读说明:本技术 麦克风阵列降噪方法、装置和电子设备 (Microphone array noise reduction method and device and electronic equipment ) 是由 黄海力 于 2021-07-08 设计创作,主要内容包括:本申请提供一种麦克风阵列降噪方法、装置和电子设备,该方法包括根据对第一原始语音信号帧的能量值进行统计所得方差、对各第二原始语音信号帧的频谱与对应时刻的第一原始语音信号帧的频谱的共轭值相乘所得能量值进行统计所得方差分别对对应的第二传输函数与第一传输函数的比值进行迭代,其中,主麦克风所拾取的语音信号帧为第一原始语音信号帧,辅麦克风所拾取的语音信号帧为第二原始语音信号帧,目标声源至主麦克风的传输函数为第一传输函数,目标声源至辅麦克风的传输函数为第二传输函数。根据该方法可实现对传输函数比值的准确估计,提高降噪效果。(The method comprises the step of respectively iterating the ratio of a corresponding second transmission function to a first transmission function according to a variance obtained by counting energy values of first original voice signal frames and a variance obtained by multiplying the frequency spectrum of each second original voice signal frame by a conjugate value of the frequency spectrum of the first original voice signal frame at a corresponding moment, wherein the voice signal frame picked up by a main microphone is the first original voice signal frame, the voice signal frame picked up by an auxiliary microphone is the second original voice signal frame, the transmission function from a target sound source to the main microphone is the first transmission function, and the transmission function from the target sound source to the auxiliary microphone is the second transmission function. According to the method, the ratio of the transmission function can be accurately estimated, and the noise reduction effect is improved.)

麦克风阵列降噪方法、装置和电子设备

技术领域

本申请属于信号处理

技术领域

,具体涉及一种麦克风阵列降噪方法、装置和电子设备。

背景技术

广义旁瓣消除技术已广泛应用于麦克风阵列的降噪处理。其中,通过扫频预先确定各个麦克风的传输函数。而事实上,各麦克风的传输函数并非一个固定值,需要实时更新。

发明内容

本申请的目的在于针对现有技术的不足之处,提供一种麦克风阵列降噪方法、装置和电子设备。

为解决上述技术问题,本申请采用如下技术方案:一种麦克风阵列降噪方法,麦克风阵列包含一个主麦克风和至少一个辅麦克风,其特征在于,所述降噪方法包括:

根据对第一原始语音信号帧的能量值进行统计所得方差、对各第二原始语音信号帧的频谱与对应时刻的第一原始语音信号帧的频谱的共轭值相乘所得能量值进行统计所得方差分别对对应的第二传输函数与第一传输函数的比值进行迭代,其中,主麦克风所拾取的语音信号帧为第一原始语音信号帧,辅麦克风所拾取的语音信号帧为第二原始语音信号帧,目标声源至主麦克风的传输函数为第一传输函数,目标声源至辅麦克风的传输函数为第二传输函数;

根据麦克风阵列中各麦克风获取的原始语音信号帧的频谱和各第二传输函数与第一传输函数的比构造增强语音信号帧的频谱;

根据第一原始语音信号帧的频谱、各第二原始语音信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的噪声信号帧的频谱;

将对应各辅麦克风的噪声信号帧的频谱进行自适应滤波之后进行累加得到抵消语音信号帧的频谱;

从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱,得到目标语音信号帧的频谱;

其中,各辅麦克风对应的自适应滤波的滤波器系数是根据目标语音信号帧的频谱更新的。

为解决上述技术问题,本申请采用如下技术方案:一种麦克风阵列降噪装置,麦克风阵列包含一个主麦克风和至少一个辅麦克风,降噪装置包括:

传输函数比更新模块,用于根据对第一原始语音信号帧的能量值进行统计所得方差、对各第二原始语音信号帧的频谱与对应时刻的第一原始语音信号帧的频谱的共轭值相乘所得能量值进行统计所得方差分别对对应的第二传输函数与第一传输函数的比值进行迭代,其中,主麦克风所拾取的语音信号帧为第一原始语音信号帧,辅麦克风所拾取的语音信号帧为第二原始语音信号帧,目标声源至主麦克风的传输函数为第一传输函数,目标声源至辅麦克风的传输函数为第二传输函数;

增强语音信号构造模块,用于根据麦克风阵列中各麦克风获取的原始语音信号帧的频谱和各第二传输函数与第一传输函数的比构造增强语音信号帧的频谱;

噪声信号构造模块,用于根据第一原始语音信号帧的频谱、各第二原始语音信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的噪声信号帧的频谱;

抵消声音信号构造模块,用于将对应各辅麦克风的噪声信号帧的频谱进行自适应滤波之后进行累加得到抵消语音信号帧的频谱;

输出模块,用于从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱,得到目标语音信号帧的频谱;

其中,各辅麦克风对应的自适应滤波的滤波器系数是根据目标语音信号帧的频谱更新的。

为解决上述技术问题,本申请采用如下技术方案:一种麦克风阵列降噪装置,包括:存储器和处理器,所述存储器存储指令,所述处理器运行所述指令以执行前述的方法。

为解决上述技术问题,本申请采用如下技术方案:一种电子设备,包括前述的麦克风阵列降噪装置。

与现有技术相比,本申请的有益效果为:各辅麦克风的传输函数与主麦克风的传输函数的比值是实时更新的,这使得增强语音信号和抵消语音信号的构造更加准确,麦克风阵列的降噪效果更佳。

附图说明

图1是根据本申请实施例的麦克风阵列降噪方法的流程示意图。

图2是根据本申请实施例的麦克风阵列降噪方法的信号流转示意图。

图3是根据本申请实施例的麦克风降噪装置的结构框图。

图4是根据本申请实施例的麦克风降噪装置的结构框图。

具体实施方式

在本申请中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中存在所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,但是并不排除存在一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。

另外还需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

下面结合附图所示的实施例对本申请作进一步说明。

如附图1所示,本申请的实施例提供一种麦克风阵列降噪方法,麦克风阵列包含一个主麦克风和至少一个辅麦克风,所述降噪方法包括以下步骤。

步骤101、根据对第一原始语音信号帧的能量值进行统计所得方差、对各第二原始语音信号帧的频谱与对应时刻的第一原始语音信号帧的频谱的共轭值相乘所得能量值进行统计所得方差分别对对应的第二传输函数与第一传输函数的比值进行迭代,其中,主麦克风所拾取的语音信号帧为第一原始语音信号帧,辅麦克风所拾取的语音信号帧为第二原始语音信号帧,目标声源至主麦克风的传输函数为第一传输函数,目标声源至辅麦克风的传输函数为第二传输函数。

具体地,对连续的原始语音信号进行分帧。每一个第一原始语音信号帧具有一个能量值。对主麦克风拾取的第一原始语音信号帧的能量值进行统计,得到截止当前时间窗口,该能量值的方差值。

具体地,对第一原始语音信号帧的频谱取共轭之后,将第二原始语音信号帧的各个频点的频谱值(为一个复数)与第一原始语音信号帧的频谱中对应频点的频谱值的共轭值相乘,该乘积表示的是能量值。将各个频点的该能量值相加所得对应该时间窗口的能量值。进而对各个时间窗口的该能量值进行统计,可以得到截止当前时间窗口的另一个方差值。

该步骤在于对第二传输函数与第一传输函数的比值进行迭代。注意,本文中第一传输函数和第二传输函数均是在频域进行表达。

步骤102、根据麦克风阵列中各麦克风获取的原始语音信号帧的频谱和各第二传输函数与第一传输函数的比构造增强语音信号帧的频谱。

增强语音信号是对目标语音信号的一种近似。

步骤103、根据第一原始语音信号帧的频谱、各第二原始语音信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的噪声信号帧的频谱。

该步骤中提取各个辅麦克风拾取的噪声信号。对应于一个时间窗口的噪声信号构成噪声信号帧。

步骤104、将对应各辅麦克风的噪声信号帧的频谱进行自适应滤波之后进行累加得到抵消语音信号帧的频谱。

抵消语音信号是需要最终被滤除的。一个时间窗口对应一个抵消语音信号帧。

步骤105、从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱,得到目标语音信号帧的频谱;其中,各辅麦克风对应的自适应滤波的滤波器系数是根据目标语音信号帧的频谱更新的。

各辅麦克风的传输函数与主麦克风的传输函数的比值是实时更新的,这使得增强语音信号和抵消语音信号的构造更加准确,麦克风阵列的降噪效果更佳。

采用迭代估计的传输函数,可以使用麦克风自行估计,这样减小由于生产等因素造成的偏差。更好的适应于耳机的实际应用环境以及耳机自身的状态。

进一步,采用此方法,可以不依赖于复杂的测量设备事先测量信道响应。以较低的成本实现降噪功能。

具体地,第二传输函数与第一传输函数的比值按照如下公式进行迭代:

Hm(t,e)=Hm(t-1,e)+μHR1_m_v(t,e)/R1_v(t,e),其中,Hm(t,e)为在当前帧周期编号为m的辅麦克风的第二传输函数与第一传输函数的比值,Hm(t-1,e)为在当前帧周期的前一帧周期编号为m的辅麦克风的第二传输函数与第一传输函数的比值,μH为学习步长,R1_m_v(t,e)为截止当前帧周期编号为m的辅麦克风的第二原始信号帧的频谱与第一原始信号帧的频谱的共轭相乘所得能量值进行统计所得的方差,R1_v(t,e)为截止当前帧周期对第一原始信号帧的能量值进行统计所得的方差。在附图2中,辅麦克风的编号从2开始。

该实施方式张楠赓,使用了最小二乘的方法,能够按照最小均方误差准则,构造出传输函数,从而将辅麦克风信号中能量与主麦克相同的部分提取出来。

具体地,R1_v(t,e)按照如下方式确定:

计算第一原始语音信号帧的能量即时值R1_v(t,e);

计算截止当前帧周期对第一原始语音信号帧的能量值进行统计的均值R1(t,e),其中,R1(t,e)=ρHR1(t-1,e)+(1-ρH)f(p)R1_t(t,e),其中,ρH为设定系数,R1(t-1,e)为截止当前帧周期的前一帧周期对第一原始语音信号帧的能量值进行统计所得的均值,f(p)为目标语音存在的概率;

计算第一原始语音信号帧的所述能量即时值与所述均值的差的平方R1_v_t(t,ej ω),R1_v_t(t,e)=(R1_t(t,e)-R1(t,e))2

其中,R1_v(t,e)=ρRR1_v(t-1,e)+(1-ρH)R1_v_t(t-1,e),ρR为设定系数。

具体地,R1_m_v(t,e)按照如下步骤确定:

计算当前帧周期编号为m的辅麦克风的第二原始语音信号帧的频谱与第一原始语音信号帧的频谱的共轭的乘积的即时值R1_m_t(t,e);

计算所述乘积的均值R1_m(t,e),其中,R1_m(t,e)=ρHR1_m_t(t-1,e)+(1-ρH)f(p)R1_m_t(t,e),ρH为设定系数,f(p)为目标语音存在的概率;

计算所述即时值与所述均值的差的平方R1_m_v_t(t,e),其中,R1_m_v_t(t,e)=(R1_m_t(t,e)-R1_m(t,e))2

其中,R1_m_v(t,e)=ρRR1_m_v(t-1,e)+(1-ρH)R1_m_v_t(t-1,e),ρR为设定系数。

主麦克风的第一传输函数记为A1(e),编号为m的辅麦克风的第二传输函数记为Am(e),编号为m的辅麦克风的第二传输函数与第一传输函数的比值Hm(e)则为:Hm(e)=Am(e)/A1(e)。

具体地,在步骤102中,定义:HT(e)=[1 H1(e) ... Hm(e)]。对HT(e)进行归一化,得到W0(e)=H(e)/||H(e)||2。参考图2,各麦克风所接收的语音信号帧的频谱依次为:Z1(t,e)、Z2(t,e)、……。

增强语音信号帧的频谱YFBF(t,e),可以根据如下公式确定:

步骤102的作用是归一化处理,保证经过这个滤波器后,人声(即增强语音信号帧)的能量不变。

具体地,在步骤103中,构造各辅麦克风的噪声信号帧的频谱:

步骤103的作用是构造噪声,Z1构成信号子空间,将Zm映射到信号子空间的能量去掉,就剩下噪声信号。

具体地,在步骤104中,以最小化E{||YFBF(t,e)-G(t,e)+U(e)||2}为目标构造自适应滤波器系数G(t,e)。使用迭代的方法获得G(t,e):其中,Pest(t,e)=ρPest(t-1,e)+(1-ρ)∑|Zm(t,e)|2

构造得到的抵消语音信号帧的频谱记为YNC(t,e)。

步骤104的作用是按照最小均方误差准则,进行迭代,构造出需要去掉的噪声能量。

步骤102至步骤104可以按照标准的广义旁瓣相消处理流程实施。

具体地,在步骤105中,将增强语音信号帧的频谱YFBF(t,e)与抵消语音信号帧的频谱记为YNC(t,e)相减即为目标语音信号帧的频谱Y(t,e)。将该频谱进行反傅里叶变换可得到时域的目标语音信号帧。

需要说明的是以上过程均是在频域进行的操作。

以上处理过程并未考虑回声信号的影响。当麦克风阵列所在的电子设备中的扬声器播放声音时(本文称为回声信号),应当停止步骤101中的迭代过程,避免将目标语音信号的方向迭代至扬声器。

即:在麦克风阵列所在电子设备上的扬声器播放回声信号的情况下,停止对第二传输函数与第一传输函数的比值进行迭代;在麦克风阵列所在耳机上的扬声器未播放回声信号的情况下,启动对第二传输函数与第一传输函数的比值进行迭代。

当存在回声信号时,可以按照如下方式消除回声信号对最终输出的目标语音信号的影响:

在麦克风阵列所在耳机上的扬声器播放回声信号的情况下,从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱,得到目标语音信号帧的频谱,包括:

根据回声信号和预设第三传输函数确定到达各麦克风的第一干扰回声信号;

根据各第一干扰回声信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的第二干扰回声信号帧的频谱;

将对应于各辅麦克风的第二干扰信号帧的频谱进行所述自适应滤波之后进行累加得到最终干扰信号帧的频谱;

从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱以及滤除最终干扰信号帧的频谱,得到目标语音信号帧的频谱。

结合图2,扬声器所播放的回声信号是已知的,第三传输函数是能够通过扫频的方式预先测量得到。从而第一干扰回声信号是能够经过计算推断出来。

将图2中的原始语音信号Z替换为第一干扰回声信号,并经图2中下半部分的H+处理(即采用步骤103构造噪声信号帧的频谱的相同的处理过程)得到第二干扰信号帧的频谱。进而经过与步骤104构造抵消语音信号帧的相同的处理过程得到最终干扰信号帧的频谱。

以上方法可以估算出回声信号对最终输出信号的影响,从而准确消除回声信号对最终输出信号的影响。

基于相同的发明构思,参考图3,本申请的实施例还提供一种麦克风阵列降噪装置,麦克风阵列包含一个主麦克风和至少一个辅麦克风,降噪装置包括:

传输函数比更新模块1,用于根据对第一原始语音信号帧的能量值进行统计所得方差、对各第二原始语音信号帧的频谱与对应时刻的第一原始语音信号帧的频谱的共轭值相乘所得能量值进行统计所得方差分别对对应的第二传输函数与第一传输函数的比值进行迭代,其中,主麦克风所拾取的语音信号帧为第一原始语音信号帧,辅麦克风所拾取的语音信号帧为第二原始语音信号帧,目标声源至主麦克风的传输函数为第一传输函数,目标声源至辅麦克风的传输函数为第二传输函数;

增强语音信号构造模块2,用于根据麦克风阵列中各麦克风获取的原始语音信号帧的频谱和各第二传输函数与第一传输函数的比构造增强语音信号帧的频谱;

噪声信号构造模块3,用于根据第一原始语音信号帧的频谱、各第二原始语音信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的噪声信号帧的频谱;

抵消声音信号构造模块4,用于将对应各辅麦克风的噪声信号帧的频谱进行自适应滤波之后进行累加得到抵消语音信号帧的频谱;

输出模块5,用于从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱,得到目标语音信号帧的频谱;

其中,各辅麦克风对应的自适应滤波的滤波器系数是根据目标语音信号帧的频谱更新的。

可选地,第二传输函数与第一传输函数的比值按照如下公式进行迭代:

Hm(t,e)=Hm(t-1,e)+μHR1_m_v(t,e)/R1_v(t,e),其中,Hm(t,e)为在当前帧周期编号为m的辅麦克风的第二传输函数与第一传输函数的比值,Hm(t-1,e)为在当前帧周期的前一帧周期编号为m的辅麦克风的第二传输函数与第一传输函数的比值,μH为学习步长,R1_m_v(t,e)为截止当前帧周期编号为m的辅麦克风的第二原始信号帧的频谱与第一原始信号帧的频谱的共轭相乘所得能量值进行统计所得的方差,R1_v(t,e)为截止当前帧周期对第一原始信号帧的能量值进行统计所得的方差。

可选地,R1_v(t,e)按照如下方式确定:

计算第一原始语音信号帧的能量即时值R1_v(t,e);

计算截止当前帧周期对第一原始语音信号帧的能量值进行统计的均值R1(t,e),其中,R1(t,e)=ρHR1(t-1,e)+(1-ρH)f(p)R1_t(t,e),其中,ρH为设定系数,R1(t-1,e)为截止当前帧周期的前一帧周期对第一原始语音信号帧的能量值进行统计所得的均值,f(p)为目标语音存在的概率;

计算第一原始语音信号帧的所述能量即时值与所述均值的差的平方R1_v_t(t,ej ω),R1_v_t(t,e)=(R1_t(t,e)-R1(t,e))2

其中,R1_v(t,e)=ρRR1_v(t-1,e)+(1-ρH)R1_v_t(t-1,e),ρR为设定系数。

可选地,R1_m_v(t,e)按照如下步骤确定:

计算当前帧周期编号为m的辅麦克风的第二原始语音信号帧的频谱与第一原始语音信号帧的频谱的共轭的乘积的即时值R1_m_t(t,e);

计算所述乘积的均值R1_m(t,e),其中,R1_m(t,e)=ρHR1_m_t(t-1,e)+(1-ρH)f(p)R1_m_t(t,e),ρH为设定系数,f(p)为目标语音存在的概率;

计算所述即时值与所述均值的差的平方R1_m_v_t(t,e),其中,R1_m_v_t(t,e)=(R1_m_t(t,e)-R1_m(t,e))2

其中,R1_m_v(t,e)=ρRR1_m_v(t-1,e)+(1-ρH)R1_m_v_t(t-1,e),ρR为设定系数。

可选地,还包括回声处理模块6,用于:

在麦克风阵列所在电子设备上的扬声器播放回声信号的情况下,停止对第二传输函数与第一传输函数的比值进行迭代;在麦克风阵列所在耳机上的扬声器未播放回声信号的情况下,启动对第二传输函数与第一传输函数的比值进行迭代。

可选地,输出模块5具体用于在麦克风阵列所在耳机上的扬声器播放回声信号的情况下执行:

根据回声信号和预设第三传输函数确定到达各麦克风的第一干扰回声信号;

根据各第一干扰回声信号帧的频谱、各第二传输函数与第一传输函数的比值,构造对应各辅麦克风的第二干扰回声信号帧的频谱;

将对应于各辅麦克风的第二干扰信号帧的频谱进行所述自适应滤波之后进行累加得到最终干扰信号帧的频谱;

从增强语音信号帧的频谱中滤除抵消语音信号帧的频谱以及滤除最终干扰信号帧的频谱,得到目标语音信号帧的频谱。

参考图4,本申请的实施例还提供一种麦克风阵列降噪装置,包括:存储器10和处理器20,所述存储器10存储指令,所述处理器20运行所述指令以执行前述的麦克风阵列降噪方法。

本申请的实施例还提供一种电子设备,包括前述的麦克风阵列降噪装置。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

本申请的保护范围不限于上述的实施例,显然,本领域的技术人员可以对本申请进行各种改动和变形而不脱离本申请的范围和精神。倘若这些改动和变形属于本申请权利要求及其等同技术的范围,则本申请的意图也包含这些改动和变形在内。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于无监督学习的语音唤醒方法、装置、电子设备及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!