一种面向数字助听器的双麦克风语音增强方法和装置

文档序号:1876912 发布日期:2021-11-23 浏览:23次 >En<

阅读说明:本技术 一种面向数字助听器的双麦克风语音增强方法和装置 (Double-microphone voice enhancement method and device for digital hearing aid ) 是由 熊志辉 陈旺 于 2021-08-25 设计创作,主要内容包括:本申请涉及一种面向数字助听器的双麦克风语音增强方法、装置、计算机设备和存储介质。所述方法包括:通过将双麦克风的语音信号变换到频域,得到第一频域信号和第二频域信号,将第二频域信号延时后得到第三频域信号,计算第一频域信号和第三频域信号的相位差后,根据相位差计算平滑系数,根据平滑系数将第一频域信号和第三频域信号进行融合,并设计滤波器,通过滤波器对混合频域信号进行滤波处理后,得到目标频域信号,再进行傅里叶反变换,得到输出的语音信号。本专利提出的方法,能够有效的提高双麦克风数字助听器输出的语音质量,且算法复杂度低,资源消耗较少,可以满足实时处理的需求。(The application relates to a dual-microphone speech enhancement method, a device, a computer device and a storage medium for a digital hearing aid. The method comprises the following steps: the method comprises the steps of converting voice signals of two microphones to a frequency domain to obtain a first frequency domain signal and a second frequency domain signal, delaying the second frequency domain signal to obtain a third frequency domain signal, calculating the phase difference between the first frequency domain signal and the third frequency domain signal, calculating a smoothing coefficient according to the phase difference, fusing the first frequency domain signal and the third frequency domain signal according to the smoothing coefficient, designing a filter, filtering the mixed frequency domain signal through the filter to obtain a target frequency domain signal, and performing Fourier inverse transformation to obtain an output voice signal. The method provided by the patent can effectively improve the voice quality output by the double-microphone digital hearing aid, has low algorithm complexity and less resource consumption, and can meet the requirement of real-time processing.)

一种面向数字助听器的双麦克风语音增强方法和装置

技术领域

本申请涉及助听器领域,特别是涉及一种面向数字助听器的双麦克风语音增强方法、装置、计算机设备和存储介质。

背景技术

随着全球人口老龄化的形式日趋严峻和社会环境的不断变化,听力障碍患者的人数正在不断快速地增加。由于现阶段医疗水平与医疗条件的限制,对于听力损失患者而言,佩戴数字助听器是目前最好的选择。

但是在日常生活中,数字助听器的效果常常会受到各种干扰噪声的影响。有研究表明,在稳态噪声环境下,助听器使用者的听力阈值比正常人的要高10-15dB;在多人说话的情况下则达到25dB甚至更高。因此,尽可能的消除外界噪声对助听器使用者来说至关重要。

传统的降噪方法大都是基于单麦克的语音降噪,主要针对平稳的白噪声,而对于人声,音乐和汽车这类的非平稳噪声,则降噪效果比较差。

发明内容

基于此,有必要针对上述技术问题,提供一种能够具有更好降噪效果的面向数字助听器的双麦克风语音增强方法、装置、计算机设备和存储介质。

一种面向数字助听器的双麦克风语音增强方法,所述方法包括:

获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号;

将所述第一语音信号和所述第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对所述第二频域信号进行延时处理得到第三频域信号;

根据所述第一频域信号和所述第三频域信号得到相位差,根据所述相位差按照预设的公式得到平滑系数;所述预设的公式中包括调节因子;所述调节因子用于调整所述第三频域信号的重要程度;

根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号;

根据所述第一频域信号、所述第三频域信号和所述平滑系数得到滤波器;

通过所述滤波器对所述混合频域信号进行滤波,得到目标频域信号;

对所述目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

在其中一个实施例中,还包括:将所述第一语音信号和所述第二语音信号进行傅里叶变换得到第一频域信号{X1(t,ω)}和第二频域信号{X2(t,ω)},对所述第二频域信号进行延时处理得到第三频域信号为:

X3(t,ω)=e-jωτX2(t,ω)

其中,t表示帧序号,ω表示角频率,{X3(t,ω)}表示所述第三频域信号,j表示复数的虚单位,τ表示第二麦克风的延时参数。

在其中一个实施例中,还包括:根据所述第一频域信号和所述第二频域信号得到相位差为:

其中,为取相位算子;

根据所述相位差按照预设的公式得到平滑系数为:

其中,φ(t,ω)为所述平滑系数,a和b为调节因子。

在其中一个实施例中,还包括:根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号为:

X4(t,ω)=φ(t,ω)·X1(t,ω)+(1-φ(t,ω))·X3(t,ω)

其中,X4(t,ω)为混合频域信号。

在其中一个实施例中,还包括:根据所述第一频域信号、所述第三频域信号和所述平滑系数得到滤波器为:

其中,H(t,ω)为滤波器。

在其中一个实施例中,还包括:通过所述滤波器对所述混合频域信号进行滤波,得到目标频域信号为:

X5(t,ω)=H(t,ω)*X4(t,ω)

其中,X5(t,ω)为目标频域信号。

在其中一个实施例中,还包括:所述调节因子的值能够根据获取的参数调整。

一种面向数字助听器的双麦克风语音增强装置,所述装置包括:

信号获取模块,用于获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号;

信号变换模块,用于将所述第一语音信号和所述第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对所述第二频域信号进行延时处理得到第三频域信号;

平滑系数确定模块,用于根据所述第一频域信号和所述第三频域信号得到相位差,根据所述相位差按照预设的公式得到平滑系数;所述预设的公式中包括调节因子;所述调节因子用于调整所述第三频域信号的重要程度;

混合频域信号确定模块,用于根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号;

滤波器确定模块,用于根据所述第一频域信号、所述第三频域信号和所述平滑系数得到滤波器;

目标频域信号确定模块,用于通过所述滤波器对所述混合频域信号进行滤波,得到目标频域信号;

语音信号输出模块,用于对所述目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号;

将所述第一语音信号和所述第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对所述第二频域信号进行延时处理得到第三频域信号;

根据所述第一频域信号和所述第三频域信号得到相位差,根据所述相位差按照预设的公式得到平滑系数;所述预设的公式中包括调节因子;所述调节因子用于调整所述第三频域信号的重要程度;

根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号;

根据所述第一频域信号、所述第三频域信号和所述平滑系数得到滤波器;

通过所述滤波器对所述混合频域信号进行滤波,得到目标频域信号;

对所述目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号;

将所述第一语音信号和所述第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对所述第二频域信号进行延时处理得到第三频域信号;

根据所述第一频域信号和所述第三频域信号得到相位差,根据所述相位差按照预设的公式得到平滑系数;所述预设的公式中包括调节因子;所述调节因子用于调整所述第三频域信号的重要程度;

根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号;

根据所述第一频域信号、所述第三频域信号和所述平滑系数得到滤波器;

通过所述滤波器对所述混合频域信号进行滤波,得到目标频域信号;

对所述目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

上述面向数字助听器的双麦克风语音增强方法、装置、计算机设备和存储介质,通过将双麦克风的语音信号变换到频域,得到第一频域信号和第二频域信号,将第二频域信号延时后得到第三频域信号,计算第一频域信号和第三频域信号的相位差后,根据相位差计算平滑系数,根据平滑系数将第一频域信号和第三频域信号进行融合,并设计滤波器,通过滤波器对混合频域信号进行滤波处理后,得到目标频域信号,再进行傅里叶反变换,得到输出的语音信号。本专利提出的方法,能够有效的提高双麦克风数字助听器输出的语音质量,且算法复杂度低,资源消耗较少,可以满足实时处理的需求,非常适合助听器的应用市场,具有很高的实用价值。

附图说明

图1为一个实施例中面向数字助听器的双麦克风语音增强方法的流程示意图;

图2为一个实施例中面向数字助听器的双麦克风语音增强方法的算法框图;

图3为一个实施例中面向数字助听器的双麦克风语音增强装置的结构框图;

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的面向数字助听器的双麦克风语音增强方法,可以应用于如下应用环境中。其中,终端执行一种面向数字助听器的双麦克风语音增强方法,通过将双麦克风的语音信号变换到频域,得到第一频域信号和第二频域信号,将第二频域信号延时后得到第三频域信号,计算第一频域信号和第三频域信号的相位差后,根据相位差计算平滑系数,根据平滑系数将第一频域信号和第三频域信号进行融合,并设计滤波器,通过滤波器对混合频域信号进行滤波处理后,得到目标频域信号,再进行傅里叶反变换,得到输出的语音信号。其中,终端可以但不限于是数字助听器中的嵌入式系统。

在一个实施例中,如图1所示,提供了一种面向数字助听器的双麦克风语音增强方法,包括以下步骤:

步骤102,获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号。

步骤104,将第一语音信号和第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对第二频域信号进行延时处理得到第三频域信号。

采用傅立叶变换将时域信号变换为频域信号的方法,可以帮助从另一个角度来了解信号的特征。信号频谱代表了信号在不同频率分量成分的大小,能够提供比时域信号波形更直观,丰富的信息。

步骤106,根据第一频域信号和第三频域信号得到相位差,根据相位差按照预设的公式得到平滑系数。

预设的公式中包括调节因子,调节因子用于调整第三频域信号的重要程度。

步骤108,根据平滑系数将第一频域信号和第三频域信号加权求和得到混合频域信号。

混合频域信号是根据平滑系数将第一频域信号和第三频域信号进行加权求和。

步骤110,根据第一频域信号、第三频域信号和平滑系数得到滤波器。

步骤112,通过滤波器对混合频域信号进行滤波,得到目标频域信号。

步骤114,对目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

上述面向数字助听器的双麦克风语音增强方法中,如图2所示,通过将双麦克风的语音信号变换到频域,得到第一频域信号和第二频域信号,将第二频域信号延时后得到第三频域信号,计算第一频域信号和第三频域信号的相位差后,根据相位差计算平滑系数,根据平滑系数将第一频域信号和第三频域信号进行融合,并设计滤波器,通过滤波器对混合频域信号进行滤波处理后,得到目标频域信号,再进行傅里叶反变换,得到输出的语音信号。本专利提出的方法,能够有效的提高双麦克风数字助听器输出的语音质量,且算法复杂度低,资源消耗较少,可以满足实时处理的需求,非常适合助听器的应用市场,具有很高的实用价值。

在其中一个实施例中,还包括:将第一语音信号和第二语音信号进行傅里叶变换得到第一频域信号{X1(t,ω)}和第二频域信号{X2(t,ω)},对第二频域信号进行延时处理得到第三频域信号为:

X3(t,ω)=e-jωτX2(t,ω)

其中,t表示帧序号,ω表示角频率,{X3(t,ω)}表示第三频域信号,j表示复数的虚单位,τ表示第二麦克风的延时参数。

在其中一个实施例中,还包括:根据第一频域信号和第二频域信号得到相位差为:

其中,为取相位算子;

根据相位差按照预设的公式得到平滑系数为:

其中,φ(t,ω)为平滑系数,a和b为调节因子,在本实施例中,a=0.9,b=5。

在其中一个实施例中,还包括:根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号为:

X4(t,ω)=φ(t,ω)·X1(t,ω)+(1-φ(t,ω))·X3(t,ω)

其中,X4(t,ω)为混合频域信号。

在其中一个实施例中,还包括:根据第一频域信号、第三频域信号和平滑系数得到滤波器为:

其中,H(t,ω)为滤波器。

在其中一个实施例中,还包括:通过滤波器对混合频域信号进行滤波,得到目标频域信号为:

X5(t,ω)=H(t,ω)*X4(t,ω)

其中,X5(t,ω)为目标频域信号。

在其中一个实施例中,还包括:调节因子的值能够根据获取的参数调整。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图3所示,提供了一种面向数字助听器的双麦克风语音增强装置,包括:信号获取模块302、信号变换模块304、平滑系数确定模块306、混合频域信号确定模块308、滤波器确定模块310、目标频域信号确定模块312和语音信号输出模块314,其中:

信号获取模块302,用于获取双麦克风数字助听器上第一麦克风的第一语音信号和第二麦克风上的第二语音信号;

信号变换模块304,用于将第一语音信号和第二语音信号进行傅里叶变换得到第一频域信号和第二频域信号,对第二频域信号进行延时处理得到第三频域信号;

平滑系数确定模块306,用于根据第一频域信号和第三频域信号得到相位差,根据相位差按照预设的公式得到平滑系数;预设的公式中包括调节因子;所述调节因子用于调整所述第三频域信号的重要程度;

混合频域信号确定模块308,用于根据平滑系数将第一频域信号和第三频域信号加权求和得到混合频域信号;

滤波器确定模块310,用于根据第一频域信号、第三频域信号和平滑系数得到滤波器;

目标频域信号确定模块312,用于通过滤波器对混合频域信号进行滤波,得到目标频域信号;

语音信号输出模块314,用于对目标频域信号进行傅里叶反变换,得到数字助听器输出的语音信号。

信号变换模块304还用于将第一语音信号和第二语音信号进行傅里叶变换得到第一频域信号{X1(t,ω)}和第二频域信号{X2(t,ω)},对第二频域信号进行延时处理得到第三频域信号为:

X3(t,ω)=e-jωτX2(t,ω)

其中,t表示帧序号,ω表示角频率,{X3(t,ω)}表示第三频域信号,j表示复数的虚单位,τ表示第二麦克风的延时参数。

平滑系数确定模块306还用于根据第一频域信号和第二频域信号得到相位差为:

其中,为取相位算子;

根据相位差按照预设的公式得到平滑系数为:

其中,φ(t,ω)为平滑系数,a和b为调节因子。

混合频域信号确定模块308还用于根据所述平滑系数对所述第一频域信号和所述第三频域信号加权求和得到混合频域信号为:

X4(t,ω)=φ(t,ω)·X1(t,ω)+(1-φ(t,ω))·X3(t,ω)

其中,X4(t,ω)为混合频域信号。

滤波器确定模块310还用于根据第一频域信号、第三频域信号和平滑系数得到滤波器为:

其中,H(t,ω)为滤波器。

目标频域信号确定模块312还用于通过滤波器对混合频域信号进行滤波,得到目标频域信号为:

X5(t,ω)=H(t,ω)*X4(t,ω)

其中,X5(t,ω)为目标频域信号。

关于面向数字助听器的双麦克风语音增强装置的具体限定可以参见上文中对于面向数字助听器的双麦克风语音增强方法的限定,在此不再赘述。上述面向数字助听器的双麦克风语音增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种面向数字助听器的双麦克风语音增强方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板等。

本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于DCT变换无次级路径建模有源噪声控制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!