语音降噪处理方法、装置、计算机设备及存储介质

文档序号:1536661 发布日期:2020-02-14 浏览:5次 >En<

阅读说明:本技术 语音降噪处理方法、装置、计算机设备及存储介质 (Voice noise reduction processing method and device, computer equipment and storage medium ) 是由 肖强 肖全之 黄荣均 方桂萍 闫玉凤 于 2019-10-21 设计创作,主要内容包括:本申请涉及一种语音降噪处理方法、装置、计算机设备及存储介质。其中,语音降噪处理方法包括当检测到语音采集设备与目标物的距离达到预设值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;获取低频带信号的幅度谱和相位谱;获取幅度谱对应的调制域信号;采用谱减法对调制域幅度谱或功率谱进行处理,得到降噪后的调制域幅度谱或功率谱;对调制域相位谱进行补偿,得到补偿后的调制域相位谱;基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。谱减法所采用的平滑过减因子避免了平滑过减因子过大导致语音消息消除过多的问题。(The application relates to a voice noise reduction processing method and device, computer equipment and a storage medium. The voice noise reduction processing method comprises the steps of obtaining a noise-containing voice signal collected by voice collection equipment when the fact that the distance between the voice collection equipment and a target object reaches a preset value is detected, and carrying out frequency division processing on the noise-containing voice signal to obtain a low-frequency band signal; acquiring an amplitude spectrum and a phase spectrum of a low-frequency band signal; acquiring a modulation domain signal corresponding to the amplitude spectrum; processing the modulation domain amplitude spectrum or the power spectrum by adopting a spectral subtraction method to obtain a modulation domain amplitude spectrum or power spectrum after noise reduction; compensating the modulation domain phase spectrum to obtain a compensated modulation domain phase spectrum; obtaining a low-frequency band signal subjected to noise reduction based on the compensated modulation domain phase spectrum, the modulation domain amplitude spectrum subjected to noise reduction and the phase spectrum of the low-frequency band signal; the noise-reduced low-frequency band signal is used for synthesizing a noise-reduced speech signal. The smooth over-reduction factor adopted by the spectral subtraction method avoids the problem that the voice message is eliminated too much due to the fact that the smooth over-reduction factor is too large.)

语音降噪处理方法、装置、计算机设备及存储介质

技术领域

本申请涉及语音降噪技术领域,特别是涉及一种语音降噪处理方法、装置、 计算机设备及存储介质。

背景技术

噪声对语音声学分析与特征中造成很大的影响,各种各样的噪声在语谱图 中产生各种杂纹导致声学特征不能正确识别和分析。在语音传输系统中,噪声 会掩蔽语音而影响是否听清语音内容,过大的噪声会导致语音识别率下降。针 对于噪声的干扰,需要进行语音降噪处理,降低噪声对语音的影响,突出语音 的特点。

在实现过程中,发明人发现传统技术中至少存在如下问题:传统方法中, 存在语音消息消除过多的问题。

发明内容

基于此,有必要针对上述技术问题,提供一种能够避免语音消息消除过多 的语音降噪处理方法、装置、计算机设备及存储介质。

为了实现上述目的,本发明实施例提供了一种语音降噪处理方法,包括步 骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪 语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功 率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调 制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子 得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位 谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在其中一个实施例中,还包括步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带 信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱, 得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率 谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得 到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:

Figure BDA0002241015980000021

Figure BDA0002241015980000022

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|S(u,w,k)|为 降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱 减,当p=2时使用的是调制域功率谱谱减;当p=1时,|V(u,w,k)|p为估计的噪 声调制域幅度谱,当p=2时,|V(u,w,k)|p为估计的噪声调制域功率谱;α(k)为 调制域平滑过减因子;|YLF(u,w,k)|p为调制域幅度谱或功率谱;SNRpost(u,w,k)为 调制域的后验信噪比;θ为平滑因子;α0为常数。

在其中一个实施例中,对调制域相位谱进行补偿,得到补偿后的调制域相 位谱的步骤包括:

采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行共轭角 调整,得到相位补偿;

或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共 轭角调整,得到相位补偿;

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。

在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调 制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相 位补偿:

Figure BDA0002241015980000031

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为 相位补偿;

Figure BDA0002241015980000032

为反对称函数;ξ为常数;|V(u,w,k)|1为估计的噪声调制域幅 度谱;

采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角 调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

Figure BDA0002241015980000033

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为 相位补偿;

Figure BDA0002241015980000034

为反对称函数;ξ为常数;|V(u,w,k)|2为估计的噪声调制域功率 谱;

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基 于以下公式,得到补偿后的相位谱:

angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);

其中,angle[S(u,w,k)]为补偿后的相位谱;angle[YLF(u,w,k)]为调制域相位谱。

根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱的步骤中,基 于以下公式,得到补偿后的相位谱:

angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);

其中,angle[S(u,w,k)]为补偿后的相位谱;angle[YLF(u,w,k)]为调制域相位谱。

在其中一个实施例中,基于补偿后的调制域相位谱、降噪后的调制域幅度 谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:

将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶反变换 和重叠相加处理,得到降噪后的低频带信号的幅度谱;

对降噪后的低频带信号的幅度谱和低频带信号相位谱依次进行傅里叶反变 换处理和重叠相加处理,得到降噪后的低频带信号。

在其中一个实施例中,基于降噪后的高频带信号的幅度谱和高频带信号的 相位谱,得到降噪后的高频带信号的步骤包括:

对高频带信号的相位谱和降噪后的高频带信号的幅度谱依次进行傅里叶反 变换处理和重叠相加,得到降噪后的低频带信号。

在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理, 得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频 带信号的幅度谱:

|S(u,w)|=|YHF(u,w)|H(u,w);

Figure BDA0002241015980000051

Figure BDA0002241015980000052

Figure BDA0002241015980000053

Figure BDA0002241015980000054

其中,|S(u,w)|为降噪后的高频带信号的幅度谱;H(u,w)为传递增益函数; |YHF(u,w)|为含噪语音高频带幅度谱;

Figure BDA0002241015980000055

为含噪语音高频带互功率谱;

Figure BDA0002241015980000056

为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的 的高频带信号;

Figure BDA0002241015980000057

为修改后的后验信噪比;

Figure BDA0002241015980000058

为增益函数;g、b、h 为常量;|Yi(u,w)Yj(u,w)|为高频带信号互幅度谱。

在其中一个实施例中,获取低频带信号的幅度谱和相位谱的步骤包括:

预处理低频带信号,得到平稳低频带信号;

采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅度谱和 相位谱。

在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包 括:

对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。

在其中一个实施例中,获取高频带信号的幅度谱和相位谱的步骤包括:

预处理高频带信号,得到平稳高频带信号;

对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和相位 谱。

在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包 括:

对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。

在其中一个实施例中,获取幅度谱对应的调制域信号的步骤包括:

采用傅里叶变换对幅度谱进行处理,得到调制域信号。

在其中一个实施例中,对含噪语音信号进行分频处理,得到低频带信号的 步骤包括:

对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;

对含噪语音信号进行分频处理,得到高频带信号的步骤包括:

对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。

本发明实施例还提供了一种语音降噪处理装置,包括:

语音信号获取模块,用于当信号采集设备之间的距离达到预设值时,获取 语音采集设备采集的含噪语音信号;

低频滤波模块,用于对含噪语音信号进行分频处理,得到低频带信号;

低频带信号频谱获取模块,用于获取低频带信号的幅度谱和相位谱;

调制域信号获取模块,用于获取幅度谱对应的调制域信号;调制域信号包 括调制域幅度谱、调制域功率谱和调制域相位谱;

调制域幅度谱处理模块,用于采用谱减法对调制域幅度谱或者功率谱进行 处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的 后验信噪比和平滑因子得到;

补偿模块,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

低频带信号降噪模块,用于基于补偿后的调制域相位谱、降噪后的调制域 幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带信 号用于合成降噪语音信号。

在其中一个实施例中,语音降噪处理装置还包括:

高频滤波模块,用于对含噪语音信号进行分频处理,得到高频带信号;

高频带信号频谱获取模块,用于获取高频带信号的幅度谱和相位谱;

高频带信号降噪模块,用于采用传递增益函数对高频带信号的幅度谱进行 处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅度 谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据高 频带信号的功率谱、互功率谱和估计的噪声互功率谱得到;

合成模块,用于合成降噪后的高频带信号和降噪后的低频带信号,得到降 噪语音信号。

本发明实施例还提供了一种计算机设备,包括存储器和处理器,存储器存 储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序, 计算机程序被处理器执行时实现上述方法的步骤。

上述技术方案中的一个技术方案具有如下优点和有益效果:

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的 语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设 值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处 理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并 对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制 域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此 过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子 得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又 避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突 然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿 处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声, 提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅 度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到 更高质量的语音信号。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请 的其它特征、目的和优点将会变得更明显:

图1为一个实施例中语音降噪处理方法的第一示意性流程示意图;

图2为一个实施例中语音降噪处理方法的第二示意性流程示意图;

图3为一个实施例中对调制域相位谱进行补偿,得到补偿后的调制域相位 谱的步骤的流程示意图;

图4为一个实施例中基于补偿后的调制域相位谱、降噪后的调制域幅度谱 和低频带信号的相位谱,得到降噪后的低频带信号的步骤的流程示意图;

图5为一个实施例中获取低频带信号的幅度谱和相位谱的步骤的流程示意 图;

图6为一个实施例中获取高频带信号的幅度谱和相位谱的步骤的流程示意 图;

图7为一个实施例中语音降噪处理装置的第一示意性结构框图;

图8为一个实施例中语音降噪处理装置的第二示意性结构框图;

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本申请,并不用于限定本申请。

在一个实施例中,如图1所示,提供了一种语音降噪处理方法,包括步骤:

S110,当信号采集设备之间的距离达到预设值时,获取语音采集设备采集 的含噪语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

其中,语音采集设备可以为本领域任意一种采集语音的设备。在一个具体 示例中,语音采集设备为麦克风。预设值可以为16cm。

具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语 音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中 调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频 处理,得到低频带信号。可选地,采用低通滤波对含噪语音信号进行处理,得 到低频带信号。在一个具体示例中,对所述含噪语音信号在分频点进行无凸起 低通滤波,得到低频带信号,从而实现在后续语音合成的过程中,分频点处没 有凸起。

S120,获取低频带信号的幅度谱和相位谱;

具体地,对低频带信号进行傅里叶变换处理,得到低频带信号的幅度谱和 相位谱。需要说明的是,也可以通过本领域任意一种手段获取低频带信号的幅 度谱和相位谱。

S130,获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调 制域功率谱和调制域相位谱;

具体地,可以通过本领域任意一种技术手段获取幅度谱对应的调制域信号。 在一个具体示例中,获取幅度谱对应的调制域信号的步骤可以包括采用傅里叶 变换对幅度谱进行处理,得到调制域信号。进一步地,可以对幅度谱在每一个 频率点分别逐帧进行短时傅里叶变化得到调制域信号。调制域信号包括调制域 幅度谱、调制域功率谱和调制域相位谱。

S140,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪 后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平 滑因子得到;

其中,采用谱减法对调制域幅度谱或者调制域功率谱进行处理,可以得到 降噪后的调制域幅度谱。

具体地,采用谱减法对调制域幅度谱进行处理,得到降噪后的调制域幅度 谱。或者,采用谱减法对调制域功率谱进行处理,可以得到降噪后的调制域功 率谱,降噪后的调制域功率谱可以转换成降噪后的调制域幅度谱,转换方式在 此不做赘述。

在其中一个实施例中,采用谱减法对调制域幅度谱或功率谱进行处理,得 到降噪后的调制域幅度谱的步骤中,基于以下公式得到降噪后的调制域幅度谱:

Figure BDA0002241015980000101

Figure BDA0002241015980000102

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;|S(u,w,k)|为 降噪后的调制域幅度谱;p是谱减法的类型,当p=1时使用的是调制域幅度谱谱 减,当p=2时使用的是调制域功率谱谱减;当p=1时,|V(u,w,k)|p为估计的噪 声调制域幅度谱,当p=2时,|V(u,w,k)|p为估计的噪声调制域功率谱;α(k)为 调制域平滑过减因子;|YLF(u,w,k)|p为调制域幅度谱或功率谱;SNRpost(u,w,k)为 调制域的后验信噪比;θ为平滑因子;α0为常数。

S150,对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景 噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号是共轭对 称的。基于此,可以通过反对称函数去改变共轭项之间的角度关系,继而可以 对调制域相位谱进行补偿,得到补偿后的调制域相位谱。

S160,基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号 的相位谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音 信号。

具体地,根据补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信 号的相位谱,可以得到降噪后的低频带信号。降噪后的低频带信号可以合成降 噪语音信号。可选地,可以获取语音信号的高频带信号,对该高频带信号和降 噪后的低频带信号进行合成,得到降噪语音信号;也可以获取语音信号的高频 带信号,然后对高频带信号进行降噪处理,将降噪后的高频带信号和降噪后的 低频带信号进行合成,得到降噪语音信号。需要说明的是,对高频带信号进行 的降噪处理方式,可以为本领域任意一种方式,在此不做具体限定。信号合成 也可以采用本领域所用的方式。

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的 语音信号在低频带存在强相关噪声,因此当语音采集设备之间的距离达到预设 值时,获取语音采集设备采集的含噪语音信号,并对含噪语音信号进行分频处 理,得到低频带信号。通过获取低频带信号的幅度谱所对应的调制域信号,并 对调制域信号进行处理,得到降噪后的语音信号。具体地,采用谱减法对调制 域幅度谱或者所述调制域功率谱进行处理,得到降噪后的调制域幅度谱,在此 过程中,谱减法所采用的平滑过减因子为根据调制域的后验信噪比和平滑因子 得到。通过此种方式,即避免了平滑过减因子过大导致语音消息消除过多,又 避免了过减因子过小使得抑制噪声能力不足,同时也不会产生相邻帧之间的突 然变化,有效地提高了语音信号的质量。进一步地,对调制域相位谱进行补偿 处理,得到补偿后的调制域相位谱,可以进一步地抑制语音信号的背景噪声, 提高语音信号的质量。因此,基于补偿后的调制域相位谱、降噪后的调制域幅 度谱和低频带信号的相位谱,得到的降噪后的低频带信号的噪声小,进而得到 更高质量的语音信号。

在一个实施例中,如图2所示,还包括步骤:

S210,对含噪语音信号进行分频处理,得到高频带信号;

具体地,可以通过本领域任意一种方式去获取语音采集设备采集的含噪语 音信号。在一个具体示例中,含噪语音信号的获取方式包括从语音采集设备中 调取含噪语音信号。可以通过本领域任意一种方式去对含噪语音信号进行分频 处理,得到高频带信号。在一个具体示例中,对所述含噪语音信号在分频点进 行无凸点高通滤波,得到高频带信号,从而实现在后续语音合成的过程中,分 频点没有凸起。需要说明的是,对含噪语音信号进行分频处理,得到高频带信 号的步骤可以与上述S110步骤一起执行,即只进行一次分频处理,便可以得到 高频带信号和低频带信号。

S220,获取高频带信号的幅度谱和相位谱;

具体地,对高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱和 相位谱。需要说明的是,也可以通过本领域任意一种手段获取高频带信号的幅 度谱和相位谱。

S230,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的 高频带信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相 位谱,得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、 互功率谱和估计的噪声互功率谱估计得到;

具体地,采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后 续的高频带信号的幅度谱。需要说明的是,当双麦的距离达到预设值时,采集 的语音信号在高频带存在弱相关噪声。采用传递增益函数处理高频带信号的幅 度谱,可以有效地对弱相关噪声进行抑制。

在其中一个实施例中,采用传递增益函数对高频带信号的幅度谱进行处理, 得到降噪后的高频带信号的幅度谱的步骤中,基于以下公式得到降噪后的高频 带信号的幅度谱:

|S(u,w)|=|YHF(u,w)|H(u,w);

Figure BDA0002241015980000132

Figure BDA0002241015980000133

Figure BDA0002241015980000134

其中,|S(u,w)|为降噪后的高频带信号的幅度谱;H(u,w)为传递增益函数; |YHF(u,w)|为含噪语音高频带幅度谱;

Figure BDA0002241015980000135

为含噪语音高频带互功率谱;

Figure BDA0002241015980000136

为估计的高频带噪声互功率谱;i、j分别为两个语音采集设备采集的 的高频带信号;

Figure BDA0002241015980000137

为修改后的后验信噪比;

Figure BDA0002241015980000138

为增益函数;g、b、h 为常量;|Yi(u,w)Yj(u,w)|为高频带信号互幅度谱。

在一个具体示例中,基于降噪后的高频带信号的幅度谱和高频带信号的相 位谱,得到降噪后的高频带信号的步骤包括:对高频带信号的相位谱和降噪后 的高频带信号的幅度谱依次进行傅里叶反变换处理和重叠相加,得到降噪后的 低频带信号。需要说明的是,也可以采用本领域任意手段得到降噪后的低频带 信号。

S240,合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信 号。

其中,对降噪后的高频带信号和降噪后的低频带信号进行合成处理,可以 得到降噪语音信号。需要说明的是,合成处理手段可以为本领域任意一种,在 此不做具体限定。

上述语音降噪处理方法,语音采集设备之间的距离达到预设值时,采集的 语音信号在高频带存在弱相关噪声,因此当语音采集设备之间的距离达到预设 值时,获取采集设备采集的含噪语音信号,并对含噪语音信号进行分频处理, 得到高频带信号。通过对高频带信号的幅度谱采用传递增益函数处理,得到降 噪后的高频带信号的幅度谱。基于降噪后的高频带信号的幅度谱和高频带信号 的相位谱,得到的降噪后的高频带信号具有更少的噪声。针对于高频带信号和 低频带信号的噪声特性,进行不同的降噪处理方法,从而获取更少噪声的语音 信号。

在其中一个实施例中,如图3所示,对调制域相位谱进行补偿,得到补偿 后的调制域相位谱的步骤包括:

S310,采用反对称函数与估计的噪声调制域幅度谱,对调制域相位谱进行 共轭角调整,得到相位补偿;

或,采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共 轭角调整,得到相位补偿;

其中,在语音降噪处理中,对调制域相位谱进行处理可以进一步抑制背景 噪声,从而提高语音质量。幅度谱是实信号,因此得到的调制域信号时共轭对 称的。基于此,可以通过反对称函数与估计的噪声调制域幅度谱,对调制域相 位谱改变共轭项之间的角度关系,继而可以对调制域相位谱进行补偿,得到补 偿后的调制域相位谱。

需要说明的是,估计的噪声调制域幅度谱或估计的噪声调制域相位谱可以 根据含噪语音信号的调制域幅度谱得到。

在其中一个实施例中,采用反对称函数与估计的噪声调制域幅度谱,对调 制域相位谱进行共轭角调整,得到相位补偿的步骤中,基于以下公式,得到相 位补偿:

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为 相位补偿;

Figure BDA0002241015980000152

为反对称函数;ξ为常数;|V(u,w,k)|1为估计的噪声调制域幅 度谱;

采用反对称函数与估计的噪声调制域功率谱,对调制域相位谱进行共轭角 调整,得到相位补偿的步骤中,基于以下公式,得到相位补偿:

Figure BDA0002241015980000153

其中,u为调制帧变量;w为离散频率变量;k为调制域变量;Λ(u,w,k)为 相位补偿;为反对称函数;ξ为常数;|V(u,w,k)|2为估计的噪声调制域功率 谱;

S320,根据相位补偿和调制域相位谱,得到补偿后的调制域相位谱。

具体而言,得到相位补偿之后,可以基于该相位补偿对调制域相位谱进行 处理,得到补偿后的调制域相位谱。

在一个具体示例中,根据相位补偿和调制域相位谱,得到补偿后的调制域 相位谱的步骤中,基于以下公式,得到补偿后的相位谱:

angle[S(u,w,k)]=angle[YLF(u,w,k)]+Λ(u,w,k);

上述语音降噪处理方法,通过获得相位补偿,并基于相位补偿对调制域相 位谱进行处理,得到补偿后的调制域相位谱,抑制了低频带信号的强相关噪声。

在其中一个实施例中,如图4所示,基于补偿后的调制域相位谱、降噪后 的调制域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号的步骤包括:

S410,将降噪后的调制域幅度谱和补偿后的调制域相位谱依次进行傅里叶 反变换和重叠相加处理,得到降噪后的幅度谱;

其中,傅里叶反变换为信号处理的常用手段之一,在此不做具体说明。

具体而言,对降噪后的调制域幅度谱和补偿后的调制域相位谱进行傅里叶 反变换处理,然后将得到的结果进行重叠相加处理,得到降噪后的幅度谱;

S420,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理和重 叠相加处理,得到降噪后的低频带信号。

具体而言,对降噪后的幅度谱和低频带信号相位谱进行傅里叶反变换处理, 然后将得到的结果进行重叠相加处理,得到降噪后的低频带信号。

在一个实施例中,如图5所示,获取低频带信号的幅度谱和相位谱的步骤 包括:

S510,预处理低频带信号,得到平稳低频带信号;

具体地,对低频带信号进行预处理,得到平稳低频带信号。预处理可以为 本领域任意一种方式,在此不做具体要求。

S520,采用傅里叶变换对平稳低频带信号进行处理,得到低频带信号的幅 度谱和相位谱。

通过对平稳低频带信号进行傅里叶变换处理,得到低频带信号的频率表达 式,进而得到低频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理低频带信号,得到平稳低频带信号的步骤包 括:对低频带信号依次进行分帧处理和加窗处理,得到平稳低频带信号。

上述语音降噪方法,通过对低频带信号进行预处理,从而得到平稳低频带 信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以 将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其 进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。

在一个实施例中,如图6所示,获取高频带信号的幅度谱和相位谱的步骤 包括:

S610,预处理高频带信号,得到平稳高频带信号;

具体地,对高频带信号进行预处理,得到平稳高频带信号。预处理可以为 本领域任意一种方式,在此不做具体要求。

S620,对平稳高频带信号进行傅里叶变换处理,得到高频带信号的幅度谱 和相位谱。

通过对平稳高频带信号进行傅里叶变换处理,得到高频带信号的频率表达 式,进而得到高频带信号的幅度谱和相位谱。

在其中一个实施例中,预处理高频带信号,得到平稳高频带信号的步骤包 括:对高频带信号依次进行分帧处理和加窗处理,得到平稳高频带信号。

上述语音降噪方法,通过对高频带信号进行预处理,从而得到平稳高频带 信号。具体地,语音信号在宏观上是不平稳的,在微观上是平稳的,从而可以 将语音信号按照以一帧为单位进行划分。将语音信号进行分帧之后,可以对其 进行加窗处理,即将分帧得到的语音信号与一个窗函数相乘,减少频谱泄露。

在一个具体实施例中,对含噪语音信号进行分频处理,得到低频带信号的 步骤包括:

对含噪语音信号进行无凸起低通滤波处理,得到低频带信号;

对含噪语音信号进行分频处理,得到高频带信号的步骤包括:

对含噪语音信号进行无凸起高通滤波处理,得到高频带信号。

上述语音降噪处理方法,通过在分频点对含噪语音信号进行无凸起低通滤 波处理,得到低频带信号和高频带信号,从而使得分频点处没有凸起。

应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示, 但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的 说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执 行。而且,图1-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些 子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行, 这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或 者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图7所示,提供了一种语音降噪处理装置,包括:

语音信号获取模块10,用于当信号采集设备之间的距离达到预设值时,获 取语音采集设备采集的含噪语音信号;

低频滤波模块20,用于对含噪语音信号进行分频处理,得到低频带信号;

低频带信号频谱获取模块30,用于获取低频带信号的幅度谱和相位谱;

调制域信号获取模块40,用于获取幅度谱对应的调制域信号;调制域信号 包括调制域幅度谱、调制域功率谱和调制域相位谱;

调制域幅度谱处理模块50,用于采用谱减法对调制域幅度谱或者功率谱进 行处理,得到降噪后的调制域幅度谱;谱减法中的平滑过减因子为根据调制域 的后验信噪比和平滑因子得到;

补偿模块60,用于对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

低频带信号降噪模块70,用于基于补偿后的调制域相位谱、降噪后的调制 域幅度谱和低频带信号的相位谱,得到降噪后的低频带信号;降噪后的低频带 信号用于合成降噪语音信号。

在其中一个实施例中,如图8所示,语音降噪处理装置还包括:

高频滤波模块80,用于对含噪语音信号进行分频处理,得到高频带信号;

高频带信号频谱获取模块90,用于获取高频带信号的幅度谱和相位谱;

高频带信号降噪模块100,用于采用传递增益函数对高频带信号的幅度谱进 行处理,得到降噪后的高频带信号的幅度谱;并基于降噪后的高频带信号的幅 度谱和高频带信号的相位谱,得到降噪后的高频带信号;传递增益函数为根据 高频带信号的功率谱、互功率和估计的噪声互功率谱估计得到;

合成模块110,用于合成降噪后的高频带信号和降噪后的低频带信号,得到 降噪语音信号。

关于语音降噪处理装置的具体限定可以参见上文中对于语音降噪处理方法 的限定,在此不再赘述。上述语音降噪处理装置中的各个模块可全部或部分通 过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算 机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以 便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其 内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、 存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提 供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。 该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存 储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口 用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一 种语音降噪处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水 显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计 算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板 或鼠标等。

本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关 的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件, 或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器 中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪 语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功 率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调 制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子 得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位 谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带 信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱, 得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率 谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程 序,计算机程序被处理器执行时实现以下步骤:

当信号采集设备之间的距离达到预设值时,获取语音采集设备采集的含噪 语音信号,并对含噪语音信号进行分频处理,得到低频带信号;

获取低频带信号的幅度谱和相位谱;

获取幅度谱对应的调制域信号;调制域信号包括调制域幅度谱、调制域功 率谱和调制域相位谱;

采用谱减法对调制域幅度谱或者调制域功率谱进行处理,得到降噪后的调 制域幅度谱;谱减法中的平滑过减因子为根据调制域的后验信噪比和平滑因子 得到;

对调制域相位谱进行补偿,得到补偿后的调制域相位谱;

基于补偿后的调制域相位谱、降噪后的调制域幅度谱和低频带信号的相位 谱,得到降噪后的低频带信号;降噪后的低频带信号用于合成降噪语音信号。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

对含噪语音信号进行分频处理,得到高频带信号;

获取高频带信号的幅度谱和相位谱;

采用传递增益函数对高频带信号的幅度谱进行处理,得到降噪后的高频带 信号的幅度谱;并基于降噪后的高频带信号的幅度谱和高频带信号的相位谱, 得到降噪后的高频带信号;传递增益函数为根据高频带信号的功率谱、互功率 谱和估计的噪声互功率谱得到;

合成降噪后的高频带信号和降噪后的低频带信号,得到降噪语音信号。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于 一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述 各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、 存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。 非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程 ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可 包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限, RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步 DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM (ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus) 直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器 总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对 上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技 术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的 普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改 进,这些都属于本申请的保护范围。因此,本发明专利的保护范围应以所附权 利要求为准。

23页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:音频处理方法、装置及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!