一种抑制扬声器串扰的方法

文档序号：142780 发布日期：2021-10-22 浏览：53次 >En<

阅读说明：本技术 一种抑制扬声器串扰的方法 (Method for inhibiting loudspeaker crosstalk ) 是由陈雅梅于 2021-07-21 设计创作，主要内容包括：本发明公开了一种抑制扬声器串扰的方法,属于音频信号处理技术领域。本发明采用基于双谱重构的方法,即综合利用声音传播通道的幅频响应和相频响应特性,在麦克风拾取通道对扬声器原信号进行重构,再对消；能很好在对拾取到的串扰信号进行抵消,既包括直达信号,也包括一定程度的多径传播的混响信号。本发明所采用的基于OLA重叠相加的时频域变换方法,减少滤波处理的延时,延时时间大幅缩短。同时,本发明采用基于多项式拟合获取频谱响应系数,解决了耳机腔体产生的回声过程中,由于多次折射和反射等复杂的过程导致的幅频响应特性和相频响应特性随声压大小呈非线性特性的问题。(The invention discloses a method for inhibiting loudspeaker crosstalk, and belongs to the technical field of audio signal processing. The invention adopts a method based on bispectrum reconstruction, namely comprehensively utilizes the amplitude-frequency response and phase-frequency response characteristics of a sound propagation channel, reconstructs and cancels the original signal of a loudspeaker in a microphone pickup channel; the picked-up crosstalk signals can be well cancelled, and the signals comprise direct signals and a certain degree of multipath propagation reverberation signals. The time-frequency domain transformation method based on OLA overlap-add reduces the delay of filtering processing and greatly shortens the delay time. Meanwhile, the invention obtains the frequency spectrum response coefficient based on polynomial fitting, and solves the problem that the amplitude-frequency response characteristic and the phase-frequency response characteristic are nonlinear along with the sound pressure due to complex processes such as multiple refraction and reflection in the echo process generated by the earphone cavity.)

一种抑制扬声器串扰的方法

技术领域

本发明属于音频信号处理技术领域，尤其涉及一种抑制扬声器串扰的方法。

背景技术

耳机或其它小功率通话设备，由于设计需要或是结构限制，存在扬声器与拾音麦克风串扰的问题，即扬声器播放的声音又被本机的麦克风拾取后回传给对方，形成回声情况。

目前解决串扰的方法，一是基于IIR型滤波器，另一种是基于自适应FIR型滤波器方法。其中，IIR型滤波器，方法实现简单，可在时域上直接滤波输出。但由于IIR型滤波器只反映了声音传输过程中幅频响应的特性，不能反映相频特性的变化，还需加入单独的延时处理环节，增加了复杂度，对于混响也无能为力。而自适应FIR型滤波器方法，采用远端扬声器信号与近端麦克风采集信号相逼近的自适应方式实现滤波，FIR滤波器具有线性相位和稳定性，可以在一定程度上反映幅频响应和相频响应的变化，对混响也有抑制作用。但这一算法对噪声较为敏感，在信噪比较低或噪声始终存在的场合，收敛过程会发散，不能起到很好地滤波作用。

另外，现有技术通用的DSP(Digital Signal Processing，数字信号处理)来说，为保证处理能力和算力瓶颈问题，一般采用2*block(数据块)的延时策略，即用一个数据块的时长去接收数据，另一块的时长内作处理，在第三个输入数据块到来时，将之前处理过的数据块同步输出；这样就会有2个数据块的延时，在fft(fast Fourier transform，快速傅立叶变换)快速傅里叶时频处理中，时间分辨率与频率分辨率是相互矛盾的；所以语音处理一般选择10ms-30ms的数据块作为处理单元，以保证短时稳定特性和长时的时变特性。即使选择10ms的数据块，最终输出也会有20ms的延时；这对延时要求苛刻的场合很难满足要求。

发明内容

基于此，本发明实施例的主要目的在于提供一种抑制扬声器串扰的方法，旨在解决通过IIR型滤波器或自适应FIR型滤波器处理串扰存在的技术问题；采用基于双谱重构的方法，即综合利用声音传播通道的幅频响应和相频响应特性，在麦克风拾取通道对扬声器原信号进行重构，再对消；能很好在对拾取到的串扰信号进行抵消，既包括直达信号，也包括一定程度的多径传播的混响信号,而且延时较小。

本发明实施例提供一种抑制扬声器串扰的方法，在麦克风拾取通道对扬声器的原始信号进行重构，得到重构信号；通过所述重构信号对在所述麦克风拾取通道拾取到的串扰信号进行抵消；所述串扰信号包括直达信号或/和混响信号。

本发明提供的一种抑制扬声器串扰的方法，包括以下步骤：

(1)基于OLA(overlap add)重叠相加的时频域变换方法，将扬声器的音频输入信号s_in，麦克风的输入信号m_in，分别以10-30ms的数据块为单位，作fft(fast Fouriertransform，快速傅立叶变换)变换，将信号变换到频域；由功率谱获得数据块时间段内的声压值，得到声压级别序数i，基于声压级别序数i得到扬声器端输入信号的幅频与相频为s_am[k][i]和麦克风的输入信号m_in，经fft后，其幅频与相频为m_am(k)和其中k为第k个频点；

(2)基于多项式拟合获取频谱响应系数，获得频谱响应系数矩阵A，求出音频输入信号s_in的幅频响应s_{re_am}[k][i]和相频响应

(3)音频信号恢复；采用谱减法对麦克风的输入信号m_in进行恢复；采用如式I所示的复指数形式获得输出频域：

其中：m_out为麦克风输入信号m_in经串扰处理后的时域信号；

为第k个频点的频域；

j为第j次迭代；

将获得的频域变换到时域

按照步骤(1)中的基于OLA重叠相加的时频域变换方法，将其最后的子块输出，得到最终的麦克风端的恢复信号。

步骤(1)中所述的基于OLA(overlap add)重叠相加的时频域变换方法，具体步骤如下：

将输入信号数据分为10-30ms的数据块；每次作fft处理的是10ms-30ms的数据块，将10ms-30ms的输入数据块分成若干子块(sub_block)，每次将最新输入的子块数据添加到fft的数据序列中，将最后的子块抛弃；这样每次作fft时，会有3个子块的重叠；ifft处理后输出时，每次只输出处理后的最后一个子块的数据，即最新的1组数据；这样，最终的延时是2倍子块数据的时长，即2*sub_block；减少滤波处理的延时。

步骤(2)中所述的基于多项式拟合获取频谱响应系数，获得频谱响应系数矩阵A，通过下述方式实现：

1)通过实验测试获取扬声器原输入音频信号在不同声压级别序数i下，其在频点k的原频率幅值am[i]，及其对应的由串扰引起的的幅频响应re_am[i]；相位Ф[i]，及其对应的串扰引起的相频响应re_Ф[i]；并组成如下幅频响应对、相频响应对：

幅频响应对：{am[k][i],re_am[k][i]}；其中，k为信号频点序号；i为声压级别序数；

相频响应对：{Ф[k][i],re_Ф[k][i]}；其中，k为信号频点序号；i为声压级别序数；

2)建立多项式方程，求解多项式系数：

y1＝a0+a1*x1+a2*x1^2+a3*x1^3+…+an*x1^n；

y2＝a0+a1*x2+a2*x2^2+a3*x2^3+…+an*x2^n；

……

ym＝a0+a1*xm+a2*xm^2+a3*xm^3+…+an*xm^n；

上式[xm,ym]，表示幅频响应对，或相频响应对；

m为声压级序号，m∈[1，M]，M为整数；

n为多项式次数，n∈[1，N]，N为整数；

将上式多项式组写成如下矩阵形式：

Y＝A^HX；

3)采用基于最小二乘法和最陡梯度下降法求解系数。

作为优选的实施方式，步骤2)中

考虑小功率扬声器混响或回声相对较小，其非线性的复杂性相对低些，减少计算的复杂度，作为优选的实施方式，可设所述的N＝3。

步骤3)中所述的采用基于最小二乘法和最陡梯度下降法求解系数，具体为：

以最小二乘法构建目标函数如式II所示：

采用最陡梯度下降及迭代方法求出A；

A_j＝A_j-1+λ*g；

其中：

j为第j次迭代；

λ为迭代步长；

g为第k次迭代的梯度矩阵；

其中第n个系数的梯度值由以下公式得到：

当式II满足阈值时，A_j即为所求系数矩阵。

步骤3)中，将所述的式I由欧拉公式展开：

步骤3)中，所述的阈值为迭代结束的条件，为迭代次数阈值或均方差阈值中先达到的一种，迭代即终止。具体的，所述迭代次数阈值，为大于设定的迭代次数阈值，迭代随即终止；所述均方差阈值，为小于设定的均方误差阈值(如0.1)，迭代随即终止。

本发明与现有技术相比，具有以下的优点和有益效果：

1.本发明采用基于双谱重构的方法，即综合利用声音传播通道的幅频响应和相频响应特性，在麦克风拾取通道对扬声器原信号进行重构，再对消；能很好在对拾取到的串扰信号进行抵消，既包括直达信号，也包括一定程度的多径传播的混响信号,而且延时较小。

2.本发明所采用的基于OLA重叠相加的时频域变换方法，将现有技术中2个数据块的延迟减小到2个子块的延迟，减少滤波处理的延时，延时时间大幅缩短。

3.本发明采用基于多项式拟合获取频谱响应系数，获得频谱响应系数矩阵A的方法，对耳机腔体回声这一复杂过程作拟合逼近；解决了耳机腔体产生的回声过程中，由于多次折射和反射等复杂的过程导致的幅频响应特性和相频响应特性随声压大小呈非线性特性的问题。

附图说明

图1为本发明一实施例具有录音功能的蓝牙耳机的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明，若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后、顶、底……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

目前，常见的解决串扰的方法，一种是基于IIR(Infinite Impulse Response，无限冲激响应)型滤波器进行解决，另一种是基于自适应FIR(Finite Impulse Response，有限冲激响应)型滤波器进行解决。但是，由于IIR型滤波器只反映声音传输过程中幅频响应的特性，不能反映相频响应特性的变化，还需加入单独的延时处理环节，增加了处理的复杂度，也不能处理混响的串扰问题。但是，通过自适应FIR型滤波器解决串扰的算法对噪声较为敏感，在信噪比较低或噪声始终存在的场合，收敛过程会发散，不能起到很好的滤波作用。

基于现有技术的缺陷，本发明实施例的主要目的在于提供一种抑制扬声器串扰的方法，旨在解决通过IIR型滤波器或自适应FIR型滤波器处理串扰存在的技术问题；采用基于双谱重构的方法，即综合利用声音传播通道的幅频响应和相频响应特性，在麦克风拾取通道对扬声器原信号进行重构，再对消；能很好在对拾取到的串扰信号进行抵消，既包括直达信号，也包括一定程度的多径传播的混响信号,而且延时较小。

本发明提供的一种抑制扬声器串扰的方法，包括以下步骤：

(1)基于OLA重叠相加的时频域变换方法，将扬声器的音频输入信号s_in，麦克风的输入信号m_in，分别以10-30ms的数据块为单位，作fft(fast Fourier transform，快速傅立叶变换)变换，将信号变换到频域；由功率谱获得数据块时间段内的声压值，得到声压级别序数i，基于声压级别序数i得到扬声器端输入信号的幅频与相频为s_am[k][i]和麦克风的输入信号m_in，经fft后，其幅频与相频为m_am(k)和其中k为第k个频点；

(2)基于多项式拟合获取频谱响应系数，获得频谱响应系数矩阵A，求出音频输入信号s_in的幅频响应s_{re_am}[k][i]和相频响应

(3)音频信号恢复；采用谱减法对麦克风的输入信号m_in进行恢复；采用如式I所示的复指数形式获得输出频域：

其中：m_out为麦克风输入信号m_in经串扰处理后的时域信号；

为第k个频点的频域；

j为第j次迭代；

将获得的频域变换到时域

按照步骤(1)中的基于OLA重叠相加的时频域变换方法，将其最后的子块输出，得到最终的麦克风端的恢复信号。

现有技术通用的DSP(Digital Signal Processing，数字信号处理)来说，为保证处理能力和算力瓶颈问题，一般采用2*block(数据块)的延时策略，即用一个数据块的时长去接收数据，另一块的时长内作处理，在第三个输入数据块到来时，将之前处理过的数据块同步输出；这样就会有2个数据块的延时。

在fft(fast Fourier transform，快速傅立叶变换)快速傅里叶时频处理中，时间分辨率与频率分辨率是相互矛盾的；所以语音处理一般选择10ms-30ms的数据块作为处理单元，以保证短时稳定特性和长时的时变特性。即使选择10ms的数据块，最终输出也会有20ms的延时；这对延时要求苛刻的场合很难满足要求。

步骤(1)中所述的基于OLA重叠相加的时频域变换方法，具体步骤如下：

如图1所示，将10ms的数据块分成4个子块，第一次参与fft的是数据块block1(输入子块0，1，2，3)；ifft后只选择子块3’输出；3’比输入子块3延时2个子块的时长。

以采样率16khZ为例，每个子块2.5ms(40个采样点)；最终时延为5ms(2*2.5ms)，如按照现有技术的2*block延时，则是20ms；本发明方法减少滤波处理的延时，延时时间大幅缩短。

对于步骤(2)中；耳机腔体产生的回声过程，包括了多次折射和反射等复杂的过程，其幅频响应特性和相频响应特性随声压大小呈非线性特性。为解决这一问题，本发明提出了基于多项式拟合的方法，对这一复杂过程作拟合逼近。

步骤(2)中所述的基于多项式拟合获取频谱响应系数，获得频谱响应系数矩阵A，通过下述方式实现：

1)通过实验，获取扬声器原输入音频信号在不同声压级别序数i下，其在频点k的原频率幅值am[i]，及其对应的由串扰引起的的幅频响应re_am[i]；相位Ф[i]，及其对应的串扰引起的相频响应re_Ф[i]；并组成如下幅频响应对、相频响应对：

幅频响应对：{am[k][i],re_am[k][i]}；其中，k为信号频点序号；i为声压级别序数；

相频响应对：{Ф[k][i],re_Ф[k][i]}；其中，k为信号频点序号；i为声压级别序数；

2)建立多项式方程，求解多项式系数：

y1＝a0+a1*x1+a2*x1^2+a3*x1^3+…+an*x1^n；

y2＝a0+a1*x2+a2*x2^2+a3*x2^3+…+an*x2^n；

……

ym＝a0+a1*xm+a2*xm^2+a3*xm^3+…+an*xm^n；

上式[xm,ym]，表示幅频响应对，或相频响应对；

m为声压级序号，m∈[1，M]，M为整数；

n为多项式次数，n∈[1，N]，N为整数；考虑小功率扬声器混响或回声相对较小，其非线性的复杂性相对低些，可设N＝3；以减少计算的复杂度；

将上式多项式组写成如下矩阵形式：

Y＝A^HX；

3)采用基于最小二乘法和最陡梯度下降法求解系数。

步骤3)中所述的采用基于最小二乘法和最陡梯度下降法求解系数，具体为：

以最小二乘法构建目标函数如式II所示：

采用最陡梯度下降及迭代方法求出A；

A_j＝A_j-1+λ*g；

其中：

j为第j次迭代；

λ为迭代步长；

g为第k次迭代的梯度矩阵；

其中第n个系数的梯度值由以下公式得到：

当式II满足阈值时，A_j即为所求系数矩阵。

步骤(3)中，将式I由欧拉公式展开：

本发明与现有技术相比，具有以下的有益效果：

2.本发明所采用的基于OLA重叠相加的时频域变换方法，将现有技术中2个数据块的延迟减小到2个子块的延迟，减少滤波处理的延时，延时时间大幅缩短。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种基于固定噪声源的降噪模块及其降噪方法

一种抑制扬声器串扰的方法

相关技术

网友询问留言