降低环境噪音的耳机

文档序号：912953 发布日期：2021-02-26 浏览：3次 >En<

阅读说明：本技术 降低环境噪音的耳机 (Earphone capable of reducing environmental noise ) 是由姚敏于 2019-08-20 设计创作，主要内容包括：一种耳机,具有电声输入传感器,用于接收声音信号并将声音信号转换为电信号。在处理一部分电信号的基础上,将语音活动检测器配置为：检测近端语音活动、远端语音活动和无语音活动,当分别存在于由电声传感器接收的声音信号中时,以及选择各自的模式,其选择编码在控制信号中。第一处理器由声音活动检测器控制,以在输出信号中至少在控制信号指示存在远端声音活动的模式时,降低远端声音活动的可理解性。(An earphone has an electro-acoustic input transducer for receiving a sound signal and converting the sound signal into an electrical signal. On the basis of processing a portion of the electrical signal, the voice activity detector is configured to: detecting near-end speech activity, far-end speech activity and no speech activity, when present in the sound signal received by the electro-acoustic transducer, respectively, and selecting a respective mode, which selection is encoded in the control signal. The first processor is controlled by the voice activity detector to reduce intelligibility of the far-end voice activity in the output signal at least when the control signal indicates the presence of the pattern of the far-end voice activity.)

降低环境噪音的耳机

技术领域

本发明涉及一种电话噪声消除系统，用于减少与移动电话通话相关的噪声，从而减少对他人的干扰，并增加移动电话用户的隐私。

背景技术

耳机可能有不同的功能，其中一个作为电话接收器，属于呼叫的近端方的用户戴着耳机捕捉她的声音，并将其传输给呼叫的远端方的一个或多个人员，并接收和复制一个或多个远端人员的声音作为声音信号。耳机在各种情况下使用，通常情况下，当耳机的使用者在附近有其他人交谈的地方时，例如大声交谈。这可能是办公室或其他地点（如呼叫中心）的情况。与此相关的经验是，耳机用户报告了远端人员能够听到的问题，并且有时能够理解佩戴耳机的人员附近的人员所说的话。因此，耳机麦克风不仅捕捉到耳机用户的声音，而且捕捉到在用户附近交谈的人的声音。这一问题在电话交谈应保密时尤为明显。

传统的、非定向的噪声抑制方法无法适当地抑制环境噪声，例如耳机佩戴者附近的人以（干扰）讲话的形式发出的噪声。更具体地说，现有技术未能提出一种基于硬件的环境噪声抑制方法，该方法具有单麦克风的可用性，同时能够抑制耳机用户附近发生的语音形式的噪声。现有技术尚未解决这个问题。

发明内容

本发明的目的是提供一种耳机，该耳机能够传递代表佩戴者言语的信号，而当该信号被复制为声音信号时，佩戴者附近的人的言语不太可能被理解。不太可能被理解为佩戴者附近的一个或多个人员的讲话更难被听到或理解。它是一个对象，与产生要从耳机通信的信号有关，为耳机提供噪声抑制，代表两者之间的权衡，一方面，保持或提高佩戴者讲话的可懂度或质量，另一方面，积极减少佩戴者附近人员的可懂度讲话。当耳机包括一个麦克风或没有波束形成意味着从耳机上的多个麦克风接收信号时，为耳机提供符合上述对象的噪声抑制是一个额外的对象。它的目标是提供符合上述权衡的耳机，同时保持较低的处理延迟。提供一种耳机，其包括：一种电声输入传感器，其设置为接收声音信号并将声音信号转换为电信号；发送器；语音活动检测器；和第一处理器，耦合以接收电信号并响应来自语音活动检测器的控制信号而向发送器生成输出信号；其中，在处理电信号的一部分的基础上，将语音活动检测器配置为：检测近端语音活动、远端语音活动和无语音活动，当分别存在于电声传感器所拾取的声音信号中时，以及选择各自的模式，其选择在控制信号中指示；其中，第一处理器由语音活动检测器控制以减少输出信号中的，至少在控制信号指示存在远端语音活动模式的时间段内，远端语音活动的可理解性。

因此，当电声传感器接收到的声音信号中分别存在时，耳机会检测近端声音活动、远端声音活动和无声音活动。作为对被检测的响应，语音活动检测器选择各自的模式，例如通过状态机，并将各自的模式传送给第一处理器，第一处理器被配置为（例如通过编程）以减少，在输出信号中，当控制信号指示远端语音活动的模式存在时，至少在部分时间段内远端语音活动的可理解性。

附图说明

图1显示了透视图中的耳机和带有处理器的耳机的方框图；

图2显示了带有语音活动检测器的处理器的框图；

图3显示了语音活动检测器的框图；

图4说明了麦克风信号；

图5说明了处理过的麦克风信号。

具体实施方式

图1显示了透视图中的耳机和带有处理器的耳机的方框图。如透视图所示，耳机101可具有带耳杯的外壳103、耳上型或耳上型，以及从外壳103延伸的麦克风臂104。

以及具有话筒端部或话筒隔层102，承载话筒，用于拾取耳机佩戴者的讲话。麦克风在下面的方框图中被指定为参考数字119。不可避免地，话筒119不仅能听到佩戴者的讲话，还能听到周围环境的噪音，如耳机101佩戴者附近的人的讲话。麦克风可以是单个麦克风，因为它一次只能是一个活动的麦克风。因此，电子波束形成不是一种选择。但是，麦克风可以配置为具有物理设计，使麦克风具有一定的方向性。

头带或头部支撑用于将耳机固定在戴耳机者的头上。在一些实施例中，耳机101可以为另一只耳朵额外配备一个耳杯。在一些实施例中，耳罩为耳塞型，并且麦克风吊杆104被连接到绳索上的直列式麦克风取代。在一些实施例中，绳索可通过耳机的基站（未显示）连接到耳机与计算机118、台式电话117或智能手机116。在一些实施例中，耳机是无线耳机，与计算机118、台式电话117、智能手机116或基站中的一个或多个无线通信。

如框图所示，耳机101（由虚线框表示）包括扬声器119和麦克风120。其他电路如前置放大器和麦克风的模拟-数字转换器未显示。

耳机101有一个电子电路106，可容纳在外壳103中。信号处理器106配置有用于接收来自麦克风119的麦克风信号的麦克风端子111、用于将扬声器信号输出到扬声器120的扬声器端子112，以及远端端口113、114、115，用于通过无线电路（未显示）将入站信号和出站信号与远端通信。

在这里和下面，远端是指通过麦克风120和耳机的出站路径121再现的通信设备、音频接收器或耳机佩戴者讲话的系统，作为出站信号或通信设备、音频源或系统进行传输，从该设备、音频源或系统通过入站路径122接收作为入站信号的音频信号，并在扬声器120中向耳机佩戴者的耳朵复制。入站路径122可包括一个或多个放大器和通常指定为110的数模转换器。入站信号和出站信号分别指从远端接收和传输到远端的任何类型的音频信号。

电子电路106还配置有发送器109，所述发送器109可包括本领域已知的电路，用于通过以下一种或多种方式适当地提供输出信号：用于在有线连接上提供输出信号的模拟放大器、缓冲器或驱动器；通过数字编解码器，根据适当的协议将输出信号作为数字输出信号提供；无线发射机，例如根据蓝牙®标准、DECT标准或Wi-Fi标准提供。发射器可与接收器组合，从远端接收信号，例如形成一个集成收发器。

集成电路106还配置有第一信号处理器107和语音活动检测器108。例如，第一信号处理器107和语音活动检测器108可以集成在可编程信号处理器中。第一处理器107耦合以接收来自麦克风119的电信号x，以响应来自语音活动检测器108的控制信号PDN而产生输出信号y到发送器109。在处理电信号的一部分X的基础上，将语音活动检测器108配置为：检测近端语音活动、远端语音活动和无语音活动，当分别存在于电声传感器所拾取的声音信号中时，以及选择各自的模式，其选择被编码在控制信号PDN中。第一处理器107由声音活动检测器108控制，以在输出信号中，当控制信号指示存在远端声音活动的模式时，至少在部分时间段内降低远端声音活动的可理解性。

图2显示了带有语音活动检测器的处理器的框图。处理器200包括延迟201，所述延迟201耦合以在滤波器202之前的信号处理阶段以数字形式延迟电信号x，其中，所述电信号x的其他功能可控制以降低如上所述的语音信号的可理解性。延迟201可通过延迟控制信号DL控制，以将电信号x延迟第一延迟时间或放弃电信号的第一延迟时间。延迟201可以作为FIFO延迟实现，例如通过循环缓冲区实现。

如上文所述，语音活动检测器108配置为检测近端语音活动、远端语音活动。在电信号被延迟201之前，没有基于电信号的语音活动。语音活动检测器108配置为瞬间执行检测，并选择由各自的控制信号PVA；DVA表示的各自模式；以及基于定时标准的NVA，以引入一定的死区时间，防止在控制信号的模式选择和编码中过渡过快。从而降低了在输出信号中引入令人不快的失真或伪影的风险。死区时间可以是模式间对称的，也可以是非对称的。

如上所述，与图1相关，第一处理器107由语音活动检测器108控制以减少输出信号中的，

至少在控制信号指示存在远端语音活动模式的时间段内，远端语音活动的可理解性。在本实施例中，第一处理器包括噪声抑制增益计算单元205、206和207，其配置为分别计算频率仓的噪声抑制增益，以便通过滤波器202相应地过滤电信号，如FIR滤波器，当所选模式与“近端语音活动”、“远端语音活动”和“无语音活动”的检测相对应时。噪声抑制增益计算单元205、206和207在时域表示或频域表示中接收信号x。频域表示可提供快速傅立叶变换，fft，单元204。

噪声抑制增益计算单元205、206和207分别输出多频箱（窄带）或跨多频箱（宽带）的噪声抑制增益G0、G1和G2。因此，噪声抑制增益G0、G1和G2可以表示为标量值或对应于频率箱数的值数组。噪声抑制增益计算单元205、206和207根据各自的控制信号PVA、DVA和NVA计算或输出各自的噪声抑制增益。

例如，如果所选模式对应于“远程语音活动”，噪声抑制增益计算单元207输出的噪声抑制增益可能表示强抑制（例如−40 dB），而如果所选模式不对应于“远程语音活动”。，噪声抑制增益计算单元207输出的噪声抑制增益可能表示没有抑制（例如0 dB）。

组合单元209接收噪声抑制增益G0、G1和G2，并输出每个频率仓的噪声抑制增益G0、G1和G2，后者具有最强的噪声抑制（即最低增益）。此操作基于未选择相应模式时噪声抑制增益设置为0 dB。应注意，噪声抑制增益计算单元205、206和207和组合单元209可配置为以其他方式根据所选模式抑制噪声。

组合单元209输出一组特定于频箱的噪声抑制增益，输入到反快速傅立叶变换（ifft）单元210，该单元210计算反快速傅立叶变换以将其结果提供给滤波器202，它可以是一个FIR滤波器，过滤电信号x，受延迟或不受延迟201的影响。

舒适性噪声可由合成噪声产生装置211产生，由此合成噪声可添加到经滤波器202过滤的电信号中。在提供输出信号y之前，可以通过加法器203添加合成噪声。

图3显示了语音活动检测器的框图。在本实施例中，语音活动检测器包括第一单元301，其配置为接收电信号x，以通过所谓的倒谱方法即时检测语音信号，例如这在语音处理技术中是已知的，并且输出指示检测是否成功的信号。

语音活动检测器还包括第二单元302，配置为接收电信号X，以瞬间检测电信号X的响度是否超过阈值，并输出指示检测是否成功的信号。

所述语音活动检测器还包括第三单元303，所述第三单元303配置为接收电信号X，以瞬间检测电信号X的信噪比是否超过阈值，并输出指示检测是否成功的信号。

由第一、第二和第三单元301、302和303输出的信号输入到即时检测单元304，后者决定应选择哪种模式。状态机305接收来自即时检测单元304的信号并向第一处理器输出控制信号其中所选状态在第一个时间段（例如1到5秒，例如1到3秒）内响应对远端语音活动的连续检测的检测而发生变化。以及其中所选状态随着检测到在第二个时间段（例如约5到20秒）内持续检测不到远端语音活动而变化。

图4示出麦克风信号x（t），作为时间的函数，t。当近端语音存在时，由第401行上的标记表示。远端语音出现的时间由第402行的标记表示。有时，当401行没有标记，402行没有标记时，与语音无关的环境噪声更有可能出现。

图5说明了作为时间函数的处理过的麦克风信号y（t）。图5与图4几何对齐，以在垂直线上表示相同的时间点。因此，可以观察到，不能引起与语音无关的环境噪声检测和不能引起近端语音活动检测的信号被有效抑制。

在一些实施例中，耳机包括延迟201，所述延迟201耦合在滤波前的信号处理阶段延迟电信号，以降低远端语音活动的可理解性；延迟201可通过延迟控制信号DL进行控制，以将电信号延迟可选的延迟时间；语音活动检测器108配置为在延迟201之前基于电信号检测近端语音活动、远端语音活动和无语音活动；语音活动检测器108生成延迟控制信号DL，以通过语音活动检测器108确定的可选延迟时间延迟电信号。

在一些实施例中，当所选模式指示“远端语音活动”时，所选延迟时间具有相对较长的持续时间，当所选模式指示检测“远端语音活动”失败时，所选延迟时间具有相对较短的持续时间。

在一些实施例中，语音活动检测器108配置为控制延迟201和一个或多个噪声抑制增益计算单元205、206和207以选择：

第一选择延迟时间，其具有相对较短的持续时间，并且选择提供相对光噪声抑制的第一噪声抑制，例如，当所选模式指示检测不到“远端语音活动”时，小于15分贝，例如约10分贝，例如小于10分贝；以及第二可选择的延迟时间，其具有相对较长的持续时间，并且在所选模式指示“远端语音活动”时选择提供相对强噪声抑制的第二噪声抑制，例如超过10分贝，例如20分贝到60分贝，例如约50分贝。

第一个可选择的延迟时间可能在小于10秒的范围内，例如小于5秒，例如约1到3秒。第二可选择的延迟时间可以在10秒以上的范围内，例如在10秒以上到30秒以下的范围内，例如大约20秒。

如果检测不到“远端语音活动”，则可以理解为选择了对应于“无语音活动”或“近端语音活动”的模式。

在一些实施例中，提供了一种耳机101，其包括：电声输入传感器119，其布置用于接收声音信号并将声音信号转换为电信号x；发射器109；声音活动检测器108；以及第一处理器107，其耦合以接收电信号x，并响应来自语音活动检测器108的控制信号PDN向发送器109生成输出信号y；其中，在处理电信号（X）的一部分的基础上，将语音活动检测器108配置为：检测与近端语音活动不同的远端语音活动，并选择其指示的模式，其选择在控制信号PDN中指示；其中，第一处理器107由声音活动检测器108控制，以在输出信号中，当控制信号PDN指示存在远端声音活动的模式时，至少分时间段降低远端声音活动的可理解性。

10页详细技术资料下载

降低环境噪音的耳机

相关技术

网友询问留言