用于控制降噪的装置、方法和计算机程序

文档序号:54721 发布日期:2021-09-28 浏览:25次 >En<

阅读说明:本技术 用于控制降噪的装置、方法和计算机程序 (Apparatus, method and computer program for controlling noise reduction ) 是由 M·维莱莫 J·马基宁 J·维卡莫 于 2019-12-13 设计创作,主要内容包括:本公开的示例涉及用于控制包括由多个麦克风捕获的音频的音频信号中的降噪的装置、方法和计算机程序。所述装置包括用于以下的模块:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频,以及将获得的一个或多个音频信号划分为多个区间。所述模块还可被配置为确定与不同区间的一个或多个噪声特性相关的一个或多个噪声特性相关的一个或多个参数,以及基于在不同区间内确定的一个或多个参数来控制用于不同区间的降噪。(Examples of the present disclosure relate to apparatus, methods and computer programs for controlling noise reduction in an audio signal comprising audio captured by a plurality of microphones. The apparatus comprises means for: obtaining one or more audio signals, wherein the one or more audio signals comprise audio captured by a plurality of microphones, and dividing the obtained one or more audio signals into a plurality of intervals. The module may be further configured to determine one or more parameters related to one or more noise characteristics for different intervals, and control noise reduction for the different intervals based on the one or more parameters determined within the different intervals.)

用于控制降噪的装置、方法和计算机程序

技术领域

本公开的示例涉及用于控制降噪的装置、方法和计算机程序。一些涉及用于控制在包括由多个麦克风捕获的音频的音频信号中的降噪的装置、方法和计算机程序。

背景技术

包括由多个麦克风捕获的音频的音频信号可用于向用户提供空间音频信号。这些信号的质量会受到由多个麦克风捕获的不想要的噪声的不利影响。

发明内容

根据本公开的各种但不一定是全部示例,提供了一种装置,其包括用于以下的模块:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于在不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

所述区间可以包括时间-频率区间。

所述噪声特性可以包括噪声电平。

可以针对不同的区间独立地确定与一个或多个噪声特性相关的参数。

确定与一个或多个噪声特性相关的一个或多个参数可包括:确定一个或多个参数是否在阈值范围内。

针对与噪声特性相关的一个或多个参数的不同阈值可用于多个区间内的不同频率范围。

与一个或多个噪声特性相关的一个或多个参数可以包括以下中的一个或多个:区间内的噪声电平、在所分析区间之前的区间中的噪声电平、用于先前频率区间的降噪方法、在频带内已经使用当前降噪方法的持续时间、捕获一个或多个音频信号的麦克风的取向。

应用于第一区间的降噪可以独立于应用于第二区间的降噪,其中第一和第二区间具有不同的频率但是时间重叠。

不同的降噪可以应用于不同的区间,其中不同的区间具有不同的频率但是时间重叠。

控制应用于区间的降噪可以包括选择用于在区间内降噪的方法。

控制应用于区间的降噪可以包括确定何时在用于一个或多个区间内的降噪的不同方法之间切换。

控制应用于区间的降噪可以包括以下中的一个或多个:提供降噪的空间输出、提供在没有降噪的情况下的空间输出、提供降噪的单声道音频输出、提供波束成形输出、提供降噪的波束成形输出。

被降低的噪声可以包括在一个或多个音频信号内由捕获音频的多个麦克风中的一个或多个麦克风已经检测到的噪声。

噪声可以包括风噪声、触摸噪声中的一个或多个。

根据本公开的各种但不一定是全部示例,提供了一种装置,包括:处理电路;以及包括计算机程序代码的存储器电路,该存储器电路和计算机程序代码被配置为与处理电路一起使得所述装置:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于在不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

根据本公开的各种但不一定是全部示例,提供了一种电子设备,其包括如上所述的装置和多个麦克风。

所述电子设备可以包括通信设备。

根据本公开的各种但不一定是所有示例,提供了一种方法,包括:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于在不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

与一个或多个噪声特性相关的参数可以针对不同的区间被独立地确定。

根据本公开的各种但不一定是所有示例,提供了一种包括计算机程序指令的计算机程序,当由处理电路执行计算机程序指令时,使得:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于在不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

可以针对不同的区间独立地确定与一个或多个噪声特性相关的参数。

根据本公开的各种但不一定是全部示例,提供了一种装置,包括用于以下的模块:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于所确定的一个或多个参数确定是提供单声道音频输出还是提供空间音频输出。

所述区间可以包括时间-频率区间。

所述噪声特性可以包括噪声电平。

提供单声道音频输出可以包括:确定具有最小噪声的麦克风信号并且使用所确定的麦克风信号来提供单声道音频输出。

提供单声道音频输出可以包括:组合来自多个麦克风中的两个或更多个麦克风的麦克风信号,其中所述多个麦克风中的两个或更多个麦克风位于彼此靠近的位置。

空间音频输出可以包括以下中的一个或多个:立体声信号、双耳信号、全景声信号。

确定与不同区间的一个或多个噪声特性相关的一个或多个参数可以包括:确定在来自多个麦克风内的不同麦克风的麦克风信号之间的能量差是否在阈值范围内。

确定与不同区间的一个或多个噪声特性相关的一个或多个参数可以包括:确定在阈值时间内是否已经在单声道音频输出和空间音频输出之间进行了切换。

不同的阈值范围可用于不同的频带。

可以为区间内的第一频带提供单声道音频输出,并且可以为区间内的第二频带提供空间音频输出,其中第一区间和第二间区间有不同的频率但时间重叠。

根据本公开的各种但不一定是全部示例,提供了一种装置,包括:处理电路;以及包括计算机程序代码的存储器电路,所述存储器电路和计算机程序代码被配置为与处理电路一起使所述装置:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于所确定的一个或多个参数来确定是提供单声道音频输出还是提供空间音频输出。

根据本公开的各种但不一定是全部示例,提供了一种电子设备,其包括上述装置和多个麦克风。

所述电子设备可以包括通信设备。

根据本公开的各种但不一定是全部示例,提供了一种方法,包括:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

提供单声道音频输出可以包括确定具有最小噪声的麦克风信号,并且使用所确定的麦克风信号来提供单声道音频输出。

根据本公开的各种但不一定是全部示例,提供了一种包括计算机程序指令的计算机程序,当由处理电路执行时,所述计算机程序指令导致:获得一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分为多个区间;确定与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于不同区间内确定的一个或多个参数来控制应用于不同区间的降噪。

提供单声道音频输出可以包括:确定具有最小噪声的麦克风信号,以及使用所确定的麦克风信号来提供单声道音频输出。

附图说明

现在将参考附图描述一些示例实施例,其中:

图1说明了一个示例装置;

图2说明了一个示例电子设备

图3说明了一个示例方法;

图4说明了另一个示例方法;

图5说明了另一个示例方法;

图6说明了另一个示例电子设备;以及

图7图示了另一个示例方法。

具体实施方式

本公开的示例涉及用于控制在包括由多个麦克风捕获的音频的音频信号中的降噪的装置101、方法和计算机程序。装置101包括用于获得301一个或多个音频信号的装置,其中所述一个或多个音频信号包括由多个麦克风203捕获的音频并且将获得的一个或多个音频信号划分303为多个区间。所述装置还可以被配置用于确定305与不同区间的一个或多个噪声特性相关的一个或多个参数,并且基于在不同区间内所确定的一个或多个参数来控制307应用于不同区间的降噪。

因此,装置101可以使不同的降噪方法能够应用于获得的音频信号内的不同区间。这可以考虑在不同频段中噪声的可感知性差异、在不同频段中的不同降噪方法之间切换的可感知性以及任何其他合适的因素,以提高输出信号的可感知质量。

图1示意性地示出了根据本公开示例的装置101。在图1的示例中,装置101包括控制器103。在图1的示例中,控制器103的实现可以作为控制器电路。在一些示例中,控制器103可以单独以硬件实现,具有在软件(包括单独的固件)中某些方面,或者可以是硬件和软件(包括固件)的组合。

如图1所示,控制器103可以使用启用硬件功能的指令来实现,例如,通过使用通用或专用处理器105中的计算机程序109的可执行指令来实现,该可执行指令可以存储在计算机可读的存储介质(磁盘、存储器等)上以由这样的处理器105执行。

处理器105被配置为对存储器107进行读取和写入。处理器105还可以包括输出接口和输入接口,处理器105通过输出接口输出数据和/或命令,数据和/或命令通过输入接口输入到处理器105。

存储器107被配置为存储计算机程序109,所述计算机程序109包括在加载到处理器105中时控制装置101的操作的计算机程序指令(计算机程序代码111)。计算机程序109的计算机程序指令提供使装置101能够执行图3、4、5和7所示方法的逻辑和例程。处理器105通过读取存储器107能够加载和执行计算机程序109。

因此,装置101包括:至少一个处理器105;以及包括计算机程序代码111的至少一个存储器107,所述至少一个存储器107和计算机程序代码111被配置为利用至少一个处理器105使装置101至少执行:获得301一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风捕获的音频;将获得的一个或多个音频信号划分303为多个区间;确定305与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于在不同区间内所确定的一个或多个参数来控制307应用于不同区间的降噪。

在一些示例中,装置101可以包括至少一个处理器105;以及包括计算机程序代码111的至少一个存储器107,所述至少一个存储器107和计算机程序代码111被配置为利用至少一个处理器105使装置101至少执行:获得501一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风203捕获的音频;将获得的一个或多个音频信号划分503为多个区间;确定505与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于所确定的一个或多个参数确定507是提供单声道音频输出还是空间音频输出。

如图1所示,计算机程序109可以通过任何合适的传递机制113到达装置101。传递机制113可以是例如机器可读介质、计算机可读介质、非暂时性计算机可读存储介质、计算机程序产品、存储设备、诸如光盘只读存储器(CD-ROM)或数字多功能光盘(DVD)或固态存储器的记录介质、包含或有形地体现计算机程序109的制品。传递机制可以是被配置为可靠地传送计算机程序109的信号。装置101可以传播或发送计算机程序109作为计算机数据信号。在一些示例中,可以使用无线协议来将计算机程序109发送给装置101,该无线协议例如蓝牙、蓝牙低功耗、蓝牙智能、6LoWPan(低功率个人区域网络上的IPv6)、ZigBee、ANT+、近场通信(NFC)、射频识别、无线局域网(无线局域网)或任何其他合适的协议。

计算机程序109包括用于使装置101至少执行以下操作的计算机程序指令:获得301一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风203捕获的音频;将获得的一个或多个音频信号划分303为多个区间;确定305与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于不同区间内所确定的一个或多个参数来控制307应用于不同区间的降噪。

在一些示例中,计算机程序109包括用于使装置101至少执行以下操作的计算机程序指令:获得501一个或多个音频信号,其中所述一个或多个音频信号包括由多个麦克风203捕获的音频;将获得一个或多个音频信号到划分503成多个区间;确定505与不同区间的一个或多个噪声特性相关的一个或多个参数;以及基于确定的一个或多个参数来确定507是提供单声道音频输出还是空间音频输出。

计算机程序指令可以被包括在计算机程序109、非暂时性计算机可读介质、计算机程序产品、机器可读介质中。在一些但不一定是所有示例中,计算机程序指令可以分布在一个以上的计算机程序109上。

尽管存储器107被示为单个组件/电路,但是它可以实现为一个或多个分开的组件/电路,其中一些或全部可以是集成的/可移除的和/或可以提供永久/半永久/动态/高速缓存的存储。

尽管处理器105被示为单个组件/电路,但是它可以实现为一个或多个分开的组件/电路,其中一些或全部可以是集成的/可移除的。处理器105可以是单核或多核处理器。

对“计算机可读存储介质”、“计算机程序产品”、“有形体现的计算机程序”等或“控制器”、“计算机”、“处理器”等,的引用应被理解为不仅包括具有不同结构的计算机,例如单/多处理器结构和串行(冯诺依曼)/并行架构,还包括专用电路,例如现场可编程门阵列(FPGA)、专用电路(ASIC)、信号处理设备和其他处理电路。对计算机程序、指令、代码等的引用应被理解为包括用于可编程处理器的软件或固件,例如硬件设备的可编程内容,无论是用于处理器的指令,还是对于固定功能设备、门阵列或可编程逻辑器设备等的配置设置。

在本申请中,术语“电路”可以指以下一项或多项或全部:

(a)纯硬件电路实现(例如仅在模拟和/或数字电路中实现)和

(b)硬件电路和软件的组合,例如(如适用):

(i)模拟和/或数字硬件电路与软件/固件的组合,和

(ii)具有软件的硬件处理器(包括数字信号处理器)的任何部分、软件和存储器,它们一起工作以使装置(例如移动电话或服务器)执行各种功能,以及

(c)需要软件(例如固件)来操作的硬件电路和/或处理器,例如微处理器或微处理器的一部分,但是当不需要软件来操作时,所述软件可能不存在。

电路的定义适用于本申请中所述术语的所有用途,包括在任何权利要求中。作为另一个的例子,如本申请中使用的,术语电路还涵盖仅硬件电路或处理器及其(或它们的)伴随软件和/或固件的实现。如果适用于特定的权利要求要素电话,术语电路还涵盖例如用于移动设备的基带集成电路或在服务器、蜂窝网络设备或其他计算或网络设备中的类似集成电路。

图2图示了示例电子设备201。示例电子设备201包括如图1所示的装置101。装置101可以包括如上所述的处理器105和存储器107。示例电子设备还包括多个麦克风203。

电子设备201可以是例如移动电话等通信设备。应当理解,该通信设备可以包括图2中未示出的组件,例如,通信设备可以包括使得能够进行无线通信的一个或多个收发器。

在一些示例中,电子设备201可以是图像捕获设备。在这样的示例中,电子设备201可以包括可以使得能够捕获图像的一个或多个相机。图像可以是视频图像、静止图像或任何其他合适类型的图像。由相机模块捕获的图像可以伴随由多个麦克风203捕获的音频。

多个麦克风203可以包括被配置为捕获声音并且使得能够提供音频信号的任何装置。音频信号可以包括表示由多个麦克风203捕获声场中的至少一些声场的电信号。麦克风203提供的输出信号可以被修改以便提供音频信号。例如,来自麦克风203的输出信号可以被滤波或均衡,或者对其执行任何其他合适的处理。

电子设备201被配置为将包括来自多个麦克风203的音频的音频信号提供给装置101。这使得装置101能够处理音频信号。在一些示例中,它可以使装置101能够处理音频信号,以便减少由麦克风203捕获的噪声的影响。

多个麦克风203可以位于电子设备201内,以使得能够捕获空间音频。例如,多个麦克风203的位置可以遍布电子设备201,以便使得能够捕获空间音频。空间音频包括一个或多个音频信号,这些音频信号可以被呈现,使得电子设备201的用户可以感知一个或多个音频信号的空间属性。例如,可以呈现空间音频,以便用户可以感知源方向和距音频源的距离。

在图2所示的示例中,电子设备201包括三个麦克风203。第一麦克风203A设置在电子设备201的第一表面上的第一端。第二麦克风203B设置在电子设备201的第二表面上的第一端。第二表面位于电子设备201的与第一表面相对的一侧。第三麦克风203C设置在电子设备201的第二端。第二端是电子装置201的与第一端相对的端。第三麦克风203C设置在与第一麦克风203A相同的表面上。应当理解,在本公开的其他示例中可以提供多个麦克风203的其他配置。同样,在其他示例中,电子设备201可以包括不同数量的麦克风203。例如,电子设备201可以包括两个麦克风203或者可以包括三个以上的麦克风203。

多个麦克风203耦合到装置101。这可以使得由多个麦克风203捕获的信号能够被提供给装置101。这可以使得包括由麦克风203捕获的音频的音频信号能够被存储在存储器107中。这也可以使处理器105能够对获得的音频信号执行降噪。降噪的示例方法如图3和图4所示。

在图2所示的示例中,捕获音频的麦克风203和执行降噪的处理器105设置在同一电子设备201内。在其他示例中,可以在不同的电子设备201中提供麦克风203和执行降噪的处理器105。例如,音频信号可以通过无线连接或一些其他合适的通信链路从多个麦克风203传输到处理设备。

图3图示了控制降噪的示例方法。所述方法可以使用如图1所示的装置101和/或如图2所示的电子设备201来实现。

所述方法包括,在框301,获得一个或多个音频信号,其中所述一个或多个音频信号表示由多个麦克风203捕获的声音信号。在一些示例中,一个或多个音频信号包括从麦克风203获得的音频,麦克风203被提供在与装置101相同的电子设备201内。在其他示例中,一个或多个音频信号可以包括从一个或多个分开的设备中提供的麦克风203中获得的音频。在这样的例子中,音频信号可以被发送到装置101。

获得的一个或多个音频信号可以包括表示由多个麦克风203捕获的声场中的至少一些声场的电信号。麦克风203提供的输出信号可以被修改以便提供音频信号。例如,来自麦克风203的输出信号可以被滤波或均衡或者对其执行任何其他合适的处理。

获得的一个或多个音频信号可以包括由空间分布的麦克风203捕获的音频,从而可以向用户提供空间音频信号。空间音频信号可以是立体声信号、双耳信号、全景声信号或任何其他合适类型的空间音频信号。

所述方法还包括,在框303,将获得的一个或多个音频信号划分为多个区间。可以使用任何合适的过程将获得的一个或多个音频信号划分为区间。区间可以是时间-频率区间、时间区间或任何其他能类型的区间。

在一些示例中,区间可以是不同的大小。例如,在区间包括时间-频率区间的情况下,用于定义时间-频率区间的频带可以对于不同的频率具有不同的大小。例如,较低频率区间可以覆盖比较高频率区间更小的频带。

在框305,所述方法包括确定与不同区间的一个或多个噪声特性相关的一个或多个参数。在一些示例中,可以为每个区间确定参数。在其他示例中,可以仅针对区间的子集确定参数。

在一些示例中,与一个或多个噪声特性相关的一个或多个参数可以提供在不同区间中是否存在噪声的指示。在其他示例中,所述方法可以包括确定是否存在噪声,然后,如果存在噪声,则确定与所确定的不同区间的噪声的一个或多个噪声特性相关的一个或多个参数。

在一些示例中,可以在确定噪声存在的同时确定与一个或多个噪声特性相关的一个或多个参数。在其他示例中,噪声的存在可以与与一个或多个噪声特性相关的一个或多个参数分开地被确定。

在一些示例中,与一个或多个噪声特性相关的一个或多个参数可以是噪声存在参数,所述噪声可以是具有等效于噪声或无噪声的值的二进制变量。无噪声值可以是用户察觉不到存在的唯一噪声的电平。在其他示例中,噪声存在可能具有一定范围的值。在一些示例中,噪声存在变量值可以与信号能量相关。与噪声特性相关的一个或多个参数可以提供指示在不同区间处所捕获的音频信号中的外部声音的量的比率或能量值,在这种情况下,可以假设剩余能量是噪声。

被分析的噪声特性与由捕获音频信号的音频的多个麦克风203中的一个或多个检测到的噪声有关。噪声可能是由麦克风203捕获的音频信号中不想要的声音。噪声可以包括不对应于由多个麦克风203捕获的声场的噪声。例如,噪声可以是风噪声、操作噪声或任何其他合适类型的噪声。在一些示例中,噪声可以包括由电子设备201的其他组件引起的噪声。例如,噪声可以包括由电子设备201内的聚焦照相机引起的噪声。被分析的噪声特性可以排除由麦克风203引入的噪声。

在一些示例中,与噪声特性相关的一个或多个参数可以包括能量比率参数,所述参数确定捕获的音频信号处的外部声音的比例,其可以包括外部声音和噪声。

与一个或多个噪声特性相关的一个或多个参数可以包括提供噪声电平和/或将改善正在分析的区间的音频质量的降噪方法的指示的任何参数。

在一些示例中,与噪声特性相关的一个或多个参数可以包括区间中的噪声电平。噪声电平可以通过监控频带之间的信号电平差异、监控由不同麦克风203捕获的音频之间的相关性或任何其他合适的方法来确定。

在一些示例中,可以监控所分析区间之前的区间中的噪声电平。例如,为了确定给定频带中的噪声电平,可以确定先前时间段中的噪声。然后可以根据先前区间中的噪声电平来预测下一个区间内噪声电平发生显著变化的概率。因此,这可以考虑这样一个事实,即单个区间可能会显示少量噪声,但这可能是其他噪声时间段内的异常情况。

在一些示例中,与噪声特性相关的一个或多个参数可包括与当前正在使用或先前已使用的降噪方法相关的参数。在这样的示例中,一个或多个参数可以包括用于频带中的先前时间区间的降噪方法、已经使用当前降噪方法的持续时间或任何其他合适的参数。

使用与降噪方法相关的参数可以实现不同类型的降噪方法之间切换发生的频率。这可以减少由在不同类型的降噪之间切换引起的伪影,因此可以提高用户感知的音频质量。

在本公开的其他示例中也可以使用与噪声特性相关的其他类型的参数。例如,在一些示例中,可以使用捕获音频的麦克风203的取向或任何其他合适参数。麦克风的取向可以给出诸如遮蔽的影响的指示,遮蔽可以影响麦克风从不同方向捕获音频的电平,并因此影响对麦克风捕获的噪声的检测。

可以针对不同的区间独立地确定与噪声特性相关的参数。例如,针对第一区间执行的分析可以独立于针对第二区间执行的分析。这可能意味着对第一区间进行的分析和确定不会影响对第二区间进行的分析和确定。

在一些示例中,确定与噪声特性相关的一个或多个参数包括确定一个或多个参数是否在阈值范围内。确定参数是否在阈值范围内可以包括:确定该参数的值是高于还是低于阈值。在一些示例中,确定参数是否在阈值范围内可以包括:确定该参数的值是否在上限值和下限值之间。

对于不同的区间,阈值的值可能不同。例如,与噪声特性相关的一个或多个参数的不同阈值可以用于多个时间-频率区间内的不同频率范围。这可以考虑到不同频带可能比其他频带更受噪声影响的事实。例如,风噪声在较低频带中可能比在较高频带中更容易察觉。此外,由于存在较高的相位差,因此不同降噪方法之间的切换在较高频带处可能更容易被用户察觉。由于电子设备201的声学遮蔽效应对于较高频带较大,所以电平差在较高频带处也可能较高。这可能使得对于较高频带过于频繁地在不同的降噪方法之间切换是不合需要的。因此,在本公开的示例中,对于切换之间的时间段的不同阈值可用于不同频带。

在框307,所述方法包括基于在不同时间-频率区间内确定的一个或多个参数来控制应用于不同区间的降噪。

控制应用于区间的降噪可以包括使用所确定的参数来选择将应用于区间的降噪方法。降噪方法的选择可以基于与噪声特性相关的参数是否被确定在阈值范围内。

降噪方法可以包括任何降低区间内噪声量的过程。在一些示例中,降噪方法可以包括以下一项或多项;提供降噪的空间输出、提供没有降噪的空间输出、提供降噪的单声道音频输出、提供波束成形的输出、提供降噪的波束成形的输出。可用的降噪类型可取决于可用空间音频的类型、用于捕获音频的麦克风203的类型、噪声电平和任何其他合适的因素。

在本公开的示例中,对于不同的区间,不同地确定与噪声特性相关的参数。这可以使不同的降噪方法能够用于不同的区间。这使得不同的频带能够同时使用不同类型的降噪。因此,例如,第一类降噪可以应用于第一频带,而同时,第二类降噪可以应用于第二频带。这可以使应用于第一区间的降噪独立于应用于第二区间的降噪,其中第一和第二区间具有不同频率但重叠时间。

在一些示例中,控制应用于区间的降噪可以包括确定何时在用于一个或多个区间内的降噪的不同方法之间切换。在这样的示例中,可以使用两种或更多种不同的降噪方法并且装置101可以使用图3所示的方法来确定何时在不同的方法之间切换。所述方法可以使不同的切换时间区间用于不同的频带。例如,在不同的降噪方法之间的切换在较高频带上可能更容易被用户感知,因为这些频带中存在较大的相位差,因此与较低频带相比,用于较高频带的在不同降噪方法之间的切换之间的时间段更长。

图4图示了控制降噪的另一个示例方法。所述方法可以使用如图1所示的装置101和/或如图2所示的电子设备201来实现。

在框401,获得多个音频信号。音频信号可以包括从多个麦克风203获得的音频。多个麦克风203可以在空间上分布以便能够提供空间音频信号。

在框403和405,将获得的音频信号划分为多个区间。在图4的例子中,音频信号被分成多个时间-频率区间。这些时间-频率区间也可以被称为时间-频率瓦片(tile)。在框403,音频信号被分成时间区间。一旦音频信号被划分成时间区间,时间区间就被转换到频域中。时间区间的时域到频域转换可以使用一个以上的时间区间。例如,短时傅里叶变换(STFT)可以使用当前和前一时间区间,并使用分析窗口(在两个时间区间上)和快速傅里叶变换(FFT)来执行变换。其他转换可以使用两个以上的时间区间。在框405,频域信号被分组为频率子带中。不同时间帧中的子带现在提供了多个时间-频率区间。

在框407,估计在不同的时间-频率区间内是否存在噪声。噪声可以是风噪声、处理噪声或可能被多个麦克风203捕获的任何其他不想要的噪声。

可以使用任何合适的过程来估计是否存在噪声。在一些示例中,对于不同频带在不同麦克风203之间的信号电平的差异可用于确定不同时间-频率区间内是否存在噪声。如果频带之间存在大的信号差异,则可以估计在较大声的信号中存在噪声。

在一些示例中,麦克风203之间的相关性可用于估计时间-频率区间中是否存在噪声。这可以作为比较不同信号电平的补充或替代。

在这样的示例中,多个麦克风203提供信号xm(n′),其中m是麦克风索引并且n′是样本索引。在这个例子中,时间区间是N个样本长,n表示频率变换信号的时间区间索引。当估计是否存在噪声时,处理器105被配置为针对时间区间索引n,针对样本索引n′=(n-1)N,...,(n+1)N-1在来自不同麦克风203的每个输入上应用正弦窗口,并且通过傅立叶变换将这些窗口化的输入信号序列变换到频域中。这导致频率变换的信号Xm(k,n),其中k是频率仓索引。这个过程称为短时傅立叶变换。频域表示被分组为具有索引b=0,...,B-1的B个子带,其中每个子带具有最低频率仓kb,low和最高频率仓kb,high,并且还包括它们之间的频率仓。

对于较低频带,麦克风203之间的距离与所述频带中的声音的波长相比较短。对于这样的频带,与第一麦克风203A和第二麦克风203B之间的相关估计相比,来自第一麦克风203A的信号的高功率估计指示来自第一麦克风203A的信号中存在噪声。

确定是否存在噪声的过程还可以考虑可能影响信号电平差异的其他因素。例如,电子设备201的主体将遮蔽音频,使得从源到电子设备201的音频在与源位于同一侧的麦克风203中更响亮,并且在另一侧的麦克风203中音频通过电子设备201的遮蔽而衰减。这种遮蔽效应在较高频率下更大,并且在估计是否存在噪声时需要考虑由遮蔽引起的信号电平差异。这可能意味着针对不同频带使用信号电平中的不同阈值以估计是否存在噪声。例如,对于较高频带可能存在较高阈值,从而与较低频带相比,在估计存在噪声之前必须检测到信号电平之间的较大差异。

在框409,确定在先前的时间-频率区间中是否使用了降噪。先前的时间-频率区间可以是在给定频带中紧接在先前的时间-频率区间之前的时间-频率区间。

如果使用了降噪,则在框411确定正在分析的当前先前时间-频率区间是否需要降噪。例如,可以确定时频区间内的噪声电平是否足够低以致不需要降噪。这可以通过确定噪声电平是高于还是低于阈值来确定。

在一些示例中,确定是否需要降噪可以包括确定已经提供具有低噪声电平的信号的麦克风203的数量。例如,如果有两个或更多个具有低噪声电平的麦克风203,则这可以使得能够在不应用降噪的情况下提供足够高质量的信号。

例如,如果噪声最小的麦克风信号和噪声次之的麦克风信号的差异不超过预期的遮蔽效应,则可以估计这两个信号包括足够低的噪声电平,使得降噪为不需要。这两个低噪声麦克风信号可用于创建空间音频信号。

遮蔽可以取决于麦克风203的布置和捕获的声音的频率。在一些示例中,遮蔽可以通过实验来确定,例如通过在消声室中从不同方向向电子设备201播放音频。在一些示例中,第一麦克风203A获得的信号和第二麦克风203B获得的信号之间的预期能量差异可以使用查表方程来估计:

ShadowAB=ShdAB(direction)*ratio.

对于高度定向的声音,所述比率向1增加,对于弱相关输入,所述比率向0减少。表ShdAB值可以通过实验室测量或任何其他合适的方法来确定。

在其他示例中,不同的值可以用作确定是否需要降噪的阈值。可以使用这个不同的值来代替或补充遮蔽所预期的效果。可以使用的其他值包括以下任何一个或多个:基于测试为电子设备201调整的频率相关但与信号无关的固定阈值,基于相关性的测量(其考虑到麦克风信号在高频处和存在风噪声时自然变得不太相关),麦克风信号之间的最大相移,其中最大相移取决于频率和麦克风距离或任何其他合适值。

在其他示例中,确定是否需要降噪可以包括确定麦克风信号之间的互相关是否高于阈值。这可以用于低频,其中相对于麦克风203之间的间隔,所捕获声音的波长很长。在这样的示例中,由一对麦克风203捕获的信号之间的互相关可以相对于麦克风能量进行归一化,以便产生0和1之间的归一化互相关值,其中0表示正交信号,而1表示完全相关信号。当归一化互相关高于诸如0.8之类的阈值时,则可以指示由麦克风对203捕获的噪声电平足够低,从而不需要降噪。

如果在框411确定需要降噪,则在框413确定当前需要的降噪方法是否与在先前时间-频率区间中使用的方法相同。这可以包括确定用于时间-频率区间的降噪的最佳方法是否与用于先前时间-频率区间的方法相同。例如,可以确定相同的麦克风信号是否用于先前时间-频率区间中的降噪方法。这可以通过检查提供最低噪声信号的麦克风203与提供先前时间-频率区间的最低噪声信号的麦克风203是否相同来实现。

如果在框413确定降噪方法不同,则在框415确定是否超过降噪时间限制。即,确定相同的降噪方法是否已经被使用了超过阈值的时间段。不同的时间段可以用于不同频带中的阈值。

时间段的阈值可以通过估计切换到不同的降噪方法是否会导致比不进行切换时留下的噪声更多的感知假象来选择。在降噪方法包括在不同麦克风之间切换的示例中,可以通过以下等式进行估计:

其中

·prevenergy是在先前时频区间中使用的麦克风203的当前时频区间内的能量

·currentenergy是具有最小噪声的麦克风203的当前时频区间的能量

·maxphase是当从先前时间-频率区间中使用的麦克风203切换到当前具有最小噪声的麦克风203时可能发生的最大相移。所述相位考虑了麦克风203之间的距离和时间-频率区间的频带。对于声音波长的一半大于麦克风203之间的距离的频率,这是最大相移180°,

·wphase是加权因子,

·time是最近一次切换发生的时间(以秒为单位)和阈值时间timeTH中的最小值。选择阈值时间使得不会在每次最低噪声麦克风203改变时发生不同麦克风203之间的切换。阈值时间可以在10到100毫秒之间或在任何其他合适的范围内。

·wtime是加权因子,

·shadow是由电子设备201引起的最大声学阴影,

·safety是常数,用于估计在估计值中的误差,并根据错误的估计值减缓切换速度,

可以为单个麦克风203或多个麦克风203计算等式中的值。在为多个麦克风203计算值的情况下,可以为等式中的项使用平均值。

如果没有超过时间限制,则在框417,将用于先前时间-频率区间的降噪方法应用于当前时间-频率区间。也就是说,在所使用的降噪方法方面不会有任何切换,以避免被用户感知假象。

如果超过时间限制,则在框419,选择当前时间-频率区间的最佳降噪方法并将其应用于当前时间-频率区间。在这样的示例中,可能已经确定不同降噪方法之间的切换将导致比音频信号内的噪声更少的假象。

如果在框413确定当前最佳降噪方法与前一时频区间中使用的方法相同,则所述方法进行到框419,并且用于当前时频区间的最佳降噪方法被选择并应用于当前的时频区间。在这种情况下,不会有在不同类型的降噪之间进行切换。

如果在框411确定不需要降噪,则在框421确定是否超过切换阈值。可以确定从应用降噪到不应用降噪的切换是否会导致比应用降噪更多的感知假象。阈值可以是时间-频率区间中的所估计噪声电平与所估计的由切换引起的假象之间的比较。

如果未超过阈值,则所述方法将进行到框413,并且遵循框413、415、417和419中描述的过程。如果确定在这种情况下应用最佳的降噪,这将是在这种情况下不应用降噪。

如果在框421确定没有超过阈值,则在框423控制降噪使得没有降噪应用于时间-频率区间。这可以在不具有框413、415和419的过程的情况下应用。

如果在框409确定在先前的时间-频率区间中没有使用降噪,则所述方法移动到框425。在框425确定是否需要降噪。在框425使用的过程可以与在框411使用的过程相同。

如果在框425确定需要降噪,则过程移至框427。在框427,确定是否超过切换阈值。可以确定从不应用降噪切换到应用降噪将引起比不需要应用降噪更多的感知假象。阈值可以是时间-频率区间中的所估计噪声电平与所估计的由切换引起的假象之间的比较。

在一些示例中,切换阈值可以是自上次在不同降噪方法之间的切换以来必须经过的固定时间限制。时间限制可以是0.1秒或任何其他合适的时间限制。在其他示例中,可以基于不同的信号电平和由切换引起的假象来估计时间限制。在一些示例中,不同的时间限制可以用于不同的频带。

从不应用降噪切换到应用一些降噪的切换阈值可以是比从应用一些降噪切换到不应用降噪的切换阈值更短的时间限制。这是因为噪声可能会突然出现,因此与快速关闭相比,能够更快速地开启降噪是有益的。

如果没有超过切换阈值,则过程移动到框423并且没有噪声降低被应用于当前时间-频率区间。在这种情况下,不同的降噪方法之间没有切换,因为这被认为提供了比噪声本身更低质量的信号。

如果超过切换阈值,则自降噪方法中的最后一次切换以来已经过了足够的时间,并且过程移动到框429。在框429,对当前时间-频率区间应用降噪。应用的降噪可以是已经被确定为对于当前噪声频率区间内的噪声电平的最佳降噪。

如果在框425确定不需要降噪,则过程移动到框431并且不对当前时间-频率区间应用降噪。

一旦根据图4所示的过程所确定应用或不应用降噪,所述方法移动到框433并且时频区间被转换回时域。时域信号然后可以被存储在存储器107和/或被提供给渲染设备用于渲染给用户。

应当理解,将根据各个时间-频率区间的需要而重复框407到433。在一些示例中,可以针对每个时间-频率区间重复所述方法。在一些示例中,可以仅针对时间-频率区间的子集重复所述方法。

图3和图4中所示方法的示例。提供的优势在于,它能够针对不同的频带使用不同的降噪方法。所述方法还允许使用不同的标准来确定何时在不同频带的不同降噪方法之间切换。因此,这提供了具有降低的噪声电平的改进质量的音频信号。

图5图示了控制降噪的另一个示例方法。所述方法可以使用如图1所示的装置101和/或如图2所示的电子设备201来实现。

所述方法包括,在框501,获得一个或多个音频信号,其中所述一个或多个音频信号表示由多个麦克风203捕获的声音信号。在一些示例中,一个或多个音频信号包括从麦克风203获得的音频,所述麦克风203被设置在与装置101相同的电子设备201内。在其他示例中,一个或多个音频信号包括从设置在一个或多个分开的设备中的麦克风203获得的音频。在这样的示例中,一个或多个音频信号可以被发送到装置101。

获得的音频信号可以包括表示由多个麦克风203捕获的声场中的至少一些的电信号。可以修改麦克风203提供的输出信号以提供音频信号。例如,来自麦克风203的输出信号可以被滤波或均衡,或者对其执行任何其他合适的处理。

获得的音频信号可以由空间分布的麦克风203捕获,从而可以向用户提供空间音频信号。空间音频信号可以是立体声信号、双耳信号、全景声信号或任何其他合适类型的空间音频信号。

所述方法还包括,在框503,将获得的一个或多个音频信号划分为多个区间。可以使用任何合适的过程将获得的一个或多个音频信号划分为区间。区间可以是时间-频率区间、时间区间或任何其他合适类型的区间。

在一些示例中,区间可以是不同的大小。例如,用于定义区间的频带对于不同的频率可以具有不同的大小。例如,较低频率区间可以覆盖比较高频率区间更小的频带。

在框505,所述方法包括确定与不同区间的一个或多个噪声特性相关的一个或多个参数。在一些示例中,可以为每个区域确定参数。在其他示例中,可以仅针对区间的子集来确定参数。

被分析的噪声特性与由捕获一个或多个音频信号的音频的多个麦克风203中的一个或多个检测到的噪声有关。噪声可能是由麦克风203捕获的音频信号中不想要的声音。噪声可以包括不对应于由多个麦克风203捕获的声场的噪声。例如,噪声可以是风噪声、操作噪声或任何其他合适类型的噪声。在一些示例中,噪声可以包括由电子设备201的其他组件引起的噪声。例如,噪声可以包括由电子设备201内的照相机聚焦引起的噪声。被分析的噪声特性可以排除由麦克风203引入的噪声。

与一个或多个噪声特性相关的一个或多个参数可以包括提供噪声电平和/或将改善正在分析的区间的音频质量的降噪方法的指示的任何参数。

在一些示例中,与噪声特性相关的一个或多个参数可以包括区间中的噪声电平。噪声电平可以通过监控频带之间的信号电平差异、监控由不同麦克风203捕获的音频信号之间的相关性或任何其他合适的方法来确定。

在一些示例中,可以监控所分析区间之前的区间中的噪声电平。例如,为了确定给定频带中的噪声电平,可以确定先前时间段中的噪声。然后可以根据先前区间中的噪声电平来预测下一个区间内噪声电平发生显著变化的概率。因此,这可以考虑这样一个事实,即单个时间区间可能会显示少量噪声,但这可能是其他噪声时间段内的异常情况。

在一些示例中,与噪声特性相关的一个或多个参数可包括与当前正在使用或先前已使用的降噪方法相关的参数。在这样的示例中,一个或多个参数可以包括用于频带中的先前时间区间的降噪方法、已经使用当前降噪方法的持续时间或任何其他合适的参数。

使用与降噪方法相关的参数可以实现在不同类型降噪方法之间的切换发生的频率。这可以减少由在不同类型的降噪之间切换引起的假象,因此可以提高用户感知的音频质量。

在本公开的其他示例中也可以使用与噪声电平相关的其他类型的参数。例如,在一些示例中,可以使用捕获音频信号或任何其他合适参数的麦克风203的方向。麦克风的方向可以给出诸如遮蔽的影响的指示,遮蔽会影响麦克风从不同方向捕获音频的电平,从而影响麦克风捕获的噪声。

可以针对区间独立地确定与噪声特性相关的参数。例如,针对第一区间执行的分析可以独立于针对第二区间执行的分析。这可能意味着对第一个区间进行的分析和确定不会影响对第二个区间进行的分析和确定。

在一些示例中,确定与噪声特性相关的一个或多个参数包括确定一个或多个参数是否在阈值范围内。确定参数是否在阈值范围内可以包括确定参数的值是高于还是低于阈值。在一些示例中,确定参数是否在阈值范围内可以包括确定参数的值是否在上限值和下限值之间。

对于不同的区间,阈值的值可能不同。例如,对于与噪声特性相关的一个或多个参数的不同阈值可以用于多个区间内的不同频率范围。这可以考虑到不同频带可能比其他频带更受噪声影响的事实。例如,风噪声在较低频带中可能比在较高频带中更容易察觉。在不同的降噪方法之间的切换也可能在更高的频带更容易被用户察觉。这可能使得对于较高频带过于频繁地在不同的降噪方法之间切换是不可取的。因此,在本公开的示例中,对于切换之间的时间段的不同阈值可用于不同频带。

在框507,所述方法包括基于所确定的一个或多个参数来确定是提供单声道音频输出还是空间音频输出。单声道音频输出可以包括音频信号,所述音频信号包括来自两个或更多个声道的音频,其中每个声道的音频信号基本相同。

单声道音频输出可以比空间音频输出更稳健,因此可以提供降低的噪声电平。因此,提供单声道音频输出而不是空间音频输出可以为音频信号提供降低的噪声输出。

在一些示例中,如果确定提供单声道音频输出,则可以确定具有最少噪声的麦克风信号,从而可以将其用于提供单声道音频输出。在一些示例中,可以通过组合来自多个麦克风203的两个或更多个麦克风信号来提供单声道音频输出。在这样的示例中,麦克风203可以彼此靠近放置。例如,麦克风203可以位于电子设备的同一端。

在本公开的示例中,可以针对多个区间内的不同频带不同地确定不同参数。在这样的示例中,这可以使得能够为第一频带提供单声道音频输出而能够为第二频带提供空间音频输出。这使得能够为区间内的第一频带提供单声道音频输出,同时为区间内的第二频带提供空间音频输出,其中第一和第二区间具有不同的频率但是时间重叠。

图6图示了另一个示例电子设备601。示例电子设备601可以用于实现图5和图7所示的方法。在一些示例中,电子设备601还可以实现图3和图4中所示的方法。还应当理解,例如图2中所示的电子设备201的其他电子设备可以用于实现图5和7中所示的方法。

图6的示例电子设备601包括装置101,其可以如图1所示。装置101可以包括如上所述的处理器105和存储器107。示例电子设备还包括多个麦克风203。在图6的601的示例中,电子设备601包括两个麦克风。

电子设备601可以是移动电话等通信设备。应当理解,通信设备可以包括图6中未示出的组件,例如,通信设备可以包括一个或多个能够进行无线通信的收发器。

在一些示例中,电子设备601可以是图像捕获设备。在这样的示例中,电子设备601可以包括能够捕获图像的一个或多个相机。图像可以是视频图像、静止图像或任何其他合适类型的图像。由相机模块捕获的图像可以伴随由多个麦克风203捕获的声音信号。

多个麦克风203可以包括被配置为捕获声音并且能够提供一个或多个音频信号的任何装置。一个或多个音频信号可以包括表示由多个麦克风203捕获的声场中的至少一些声场的电信号。可以修改麦克风203提供的输出信号以便提供音频信号。例如,来自麦克风203的输出信号可以被滤波或均衡,或者对其执行任何其他合适的处理。

电子设备601被配置为使得包括来自多个麦克风203的音频的音频信号被提供给装置101。这使得装置101能够处理音频信号。在一些示例中,它可以使装置101能够处理音频信号以减少由麦克风203捕获的噪声的影响。

多个麦克风203可以位于电子设备601内,以便能够捕获空间音频。例如,多个麦克风203的位置可以分布遍及电子设备601以便使得能够捕获空间音频。空间音频包括可以被渲染的音频信号,使得电子设备601的用户可以感知音频信号的空间特性。例如,可以渲染空间音频,以便用户可以感知源方向和距音频源的距离。

在图6所示的示例中,电子设备601包括两个麦克风203。第一麦克风203A设置在电子设备601的第一表面上的第一端。在电子设备601的第二端提供第二麦克风203B。第二端是电子装置601的与第一端相对的端。第二麦克风203B设置在与第一麦克风203A相同的表面上。应当理解,在本公开的其他示例中,可以提供多个麦克风203的其他配置。

多个麦克风203耦合到装置101。这可以使得由多个麦克风203捕获的音频信号能够被提供给装置101。这可以使音频信号能够被存储在存储器107中。这也可以使处理器105能够对获得的音频信号执行降噪。降噪的示例方法如图5和图7所示。

在图6所示的示例中,捕获音频的麦克风203和执行降噪的处理器105设置在同一电子设备601内。在其他示例中,麦克风203和执行降噪的处理器105可以设置在不同的电子设备601中。例如,音频信号可以通过无线连接或一些其他合适的通信链路从多个麦克风203传输到处理设备。

图7图示了控制降噪的另一个示例方法。所述方法可以使用如图1所示的装置101和/或如图6所示的电子设备601来实现。

在框701,获得多个音频信号。音频信号可以包括从多个麦克风203获得的音频。多个麦克风203可以在空间上分布以便能够提供空间音频信号。在图7的例子中,获得了两个音频信号。

在框703和705,获得的音频信号被划分为多个区间。在图7的示例中,音频信号被划分为多个时频区间。这些时频区间也可以被称为时频瓦片。在框703,音频信号被分成时间区间。一旦音频信号已经被划分成时间区间,时间区间就被转换到频域中。时间区间的时域到频域转换可以使用一个以上的时间区间。例如,短时傅里叶变换(STFT)可以使用当前和前一时间区间,并使用分析窗口(在两个时间区间上)和快速傅里叶变换(FFT)来执行变换。其他转换可以使用两个时间区间以外的时间区间。在框705,频域信号被分组为频率子带。不同时间帧中的子带现在提供多个时间-频率区间。

在框707,针对不同的时间-频率区间计算麦克风信号能量。一旦已经计算了麦克风信号能量,就可以比较不同时间-频率区间的能量。

在框709,估计时间-频率区间中是否存在噪声。噪声可以是风噪声、处理噪声或可能被多个麦克风203捕获的任何其他不想要的噪声。

可以使用任何合适的过程来估计是否存在噪声。在一些示例中,不同时间-频率区间的能量的比较可用于确定是否存在噪声。如果频带之间存在大的能量差异,则可以估计较大的信号中存在噪声。

确定是否存在噪声的过程可以考虑可能影响信号电平差异的因素,例如遮蔽。例如,电子设备601的主体将遮蔽音频,使得从源到电子设备601的音频在与源位于同一侧的麦克风203中更响亮,并且在麦克风203的另一侧音频被电子设备601的遮蔽衰减。这种遮蔽效应在较高频率处更大,并且在估计是否存在噪声时需要考虑由遮蔽引起的信号电平差异。这可能意味着针对不同频带使用信号电平差异的不同阈值来估计是否存在噪声。例如,对于较高频带可能存在较高阈值,从而与较低频带相比,在估计存在噪声之前必须检测到信号电平之间的较大差异。

在其他示例中,可以替代地使用用于确定是否存在噪声的其他方法。例如,可以使用不同时间-频率区间中能量的互相关。

对于多个时间-频率区间内的不同频带,用于确定时间-频率区间内是否存在噪声的阈值可以不同。阈值被选择为使得与高频带相比,装置101更有可能将单声道音频输出用于低频带。例如,与较低频率相比,较高的频率可以使用较高的信号差异阈值。在一些示例中,对于低频带阈值可以是10dB,对于高频带阈值可以是15dB。在其他示例中,对于低频带阈值可以是5dB,对于高频带阈值可以是10dB。应当理解,在本公开的其他示例中可以使用阈值的其他值。这考虑了较低频带比较高频带更容易受到噪声影响的事实。这也可能考虑到在较高频带中可能更难以准确检测噪声的存在。

如果在框709估计存在噪声,则所述方法移动到框711。在框711,具有最小噪声的麦克风信号被用于提供单声道音频输出。在一些示例中,可以存在提供具有低噪声的信号的两个或更多个麦克风203。然而,如果这些麦克风203靠近在一起,例如如果它们位于电子设备601的同一端,则两个麦克风信号可以组合以提供单声道音频输出。可以通过求和或使用任何其他合适的方法来组合麦克风信号。

如果在框709估计不存在噪声,或者如果估计的噪声存在低于阈值,则所述方法移至框713。在框713,两个或更多个麦克风信号被用于提供空间音频输出。空间音频输出可以是立体声信号、双耳信号、全景声信号或任何其他合适的空间音频输出。应当理解,可以使用任何合适的过程来从获得的音频信号生成空间音频输出。

一旦如图7所示的过程所确定的那样提供了单声道音频输出或空间音频输出,该方法就移至框715并且将时间-频率区间转换回时域。时域信号然后可以被存储在存储器107中和/或提供给渲染设备用于渲染给用户。

应当理解,将针对各个时间-频率区间的需要而重复框707到714。在一些示例中,可以针对每个时间-频率区间而重复所述方法。在一些示例中,可以仅针对时间-频率区间的子集而重复所述方法。

因此,本公开的示例通过控制在用于不同频带的空间音频输出和单声道音频输出之间的切换来提供具有改进的噪声电平的音频输出信号。这考虑到较低频带比较高频带更容易受到噪声的影响。

由于人类对较高频率的声音方向不太敏感,因此将较低频率限制为单声道音频输出也可能导致用户感知到的假象较少。

应当理解,可以对上述示例方法和装置101进行修改。例如,当捕获音频信号时,噪声的影响可能取决于电子设备201、601的取向。这可能意味着一些麦克风203在电子设备201、601以第一取向使用时比在电子设备201、601以第二取向使用时更可能受到噪声的影响。然后,在选择要使用的降噪方法或在单声道音频输出和空间音频输出之间进行选择时,可以使用此信息。例如,它可以使得能够应用不同的阈值和/或加权因子,以便偏向使用不太可能受针对电子设备201、601的给定取向的噪声影响的麦克风信号。

上述示例发现应用于以下组件:汽车系统;电信系统;电子系统,包括消费电子产品;分布式计算系统;用于生成或呈现媒体内容的媒体系统,媒体内容包括音频、视频和视听内容以及混合、中介、虚拟和/或增强现实;个人系统,包括个人健康系统或个人健身系统;导航系统;用户界面也称为人机界面;网络,包括蜂窝、非蜂窝和光网络;自组织网络;互联网;物联网;虚拟化网络;以及相关的软件和服务。

本文件中使用的术语“包括”具有包容性而非排他性的含义。即对包含Y的X的任何提及指示X可仅包含一个Y或可包含一个以上的Y。如果意在使用具有排他意义的“包含”,那么将在上下文中通过提及“仅包含一个……”或通过使用“由……组成”来明确表示。

在本说明书中,参考了各种示例。与示例相关的特征或功能的描述表明这些特征或功能存在于所述示例中。在文本中使用术语“示例”或“例如”或“可以”或“可能”表示,是否无论是否明确声明,此类特征或功能至少存在于所描述的示例中,无论是否被描述为示例,并且它们可以但不一定存在于一些或所有其他示例中。因此,“示例”或“例如”或“可以”或“可能”指的是一类示例中的具体实例。实例的属性可以是仅所述实例的属性或类的属性或类的子类的属性,所述子类包括类中的一些但不是全部实例。因此,隐含地公开了参考一个示例而不是参考另一示例描述的特征,在可能的情况下可以在所述其他示例中用作工作组合的一部分,但不一定必须在所述其他示例中使用。

尽管在前面的段落中已经参考各种示例描述了实施例,但是应当理解,在不脱离权利要求的范围的情况下,可以对给出的示例进行修改。

在前面的描述中描述的特征可以以不同于以上明确描述的组合之外的组合中使用。

尽管已经参考某些特征描述了功能,但是无论是否描述,这些功能都可以由其他特征执行。

尽管已经参考某些实施例描述了特征,但是那些特征也可以存在于其他实施例中,无论是否描述。

本文档中使用的术语“一个”或“该”具有包容性而非排他性含义。即对包含一个/该Y的X的任何提及指示X可仅包含一个Y或可包含多于一个的Y,除非上下文清楚地表明相反。如果打算使用具有排他含义的“一个”或“该”,则将在上下文中明确说明。在某些情况下,可以使用“至少一个”或“一个或多个”来强调包含的含义,但不应该将缺少这些术语视为推断和排除的含义。

权利要求中特征(或特征组合)的存在是对所述特征或(特征组合)本身的引用,也是对实现基本相同技术效果的特征(等效特征)的引用。等效特征包括例如变体的特征并且以基本相同的方式实现基本相同的结果。等效特征包括例如以基本相同的方式执行基本相同的功能以实现基本相同的结果的特征。

在本说明书中,已经参考了使用形容词或形容词短语来描述示例特征的各种示例。与示例相关的特性的这种描述表明所述特性完全如所描述地存在于一些示例中,并且基本上如所描述那样存在于其他示例中。

尽管在前述说明书中努力提请注意那些被认为是重要的特征,但应当理解,无论是否强调了这一点,申请人可以通过权利要求就上文提及和/或在附图中示出的任何可专利特征或特征组合寻求保护。

27页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音识别装置和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!