一种基于四麦阵列的多方会议通话系统及方法

文档序号:52859 发布日期:2021-09-28 浏览:58次 >En<

阅读说明:本技术 一种基于四麦阵列的多方会议通话系统及方法 (Multi-party conference call system and method based on four-microphone array ) 是由 胡程远 于 2021-06-11 设计创作,主要内容包括:本发明公开了一种基于四麦阵列的多方会议通话系统及方法,系统包括:麦克风模块:用于收集声源的声音;仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。本发明通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。(The invention discloses a multiparty conference call system and a multiparty conference call method based on a four-microphone array, wherein the system comprises the following components: a microphone module: for collecting sound of a sound source; a simulation processing module: the system comprises a sound source, a sound processing unit and a control unit, wherein the sound processing unit is used for carrying out simulation processing on sound of the sound source to generate four sound zones, and the sound zones comprise audio signals which are used for distinguishing sound source directions; the microphone module comprises a microphone array consisting of four microphones, and the four microphones are respectively positioned in four different directions. The invention divides the space into four sound zones, distinguishes the sound source direction according to the audio signals of the sound zones, realizes the function of multi-party speaking of the conference equipment and can distinguish the direction, and simultaneously effectively improves the quality of voice communication.)

一种基于四麦阵列的多方会议通话系统及方法

技术领域

本发明涉及会议通话

技术领域

,具体涉及一种基于四麦阵列的多方会议通话系统及方法。

背景技术

全球化经济快速发展的过程中,远程会议的使用越来越普遍,传统单麦克风的电话会议系统在拾音质量、回声以及环境噪声抑制方面已经难以满足需求,传统麦克风阵列的电话会议系统通过采用多通道去混响和回声消除技术,大大的提高了语音通话质量。

随着科技的不断进步,会议设备进行多方通话的需求也越来越多,要求设备可以支持多人同时对话且可以区分不同方位的说话人,虽然传统多麦克风阵列通过空域滤波特性和多通道去混响技术有效提升了语音质量,但仍难以实现会议设备多方说话且可以区分方位的功能。

发明内容

针对现有技术中的缺陷,本发明提供一种基于四麦阵列的多方会议通话系统及方法。

第一方面,一种基于四麦阵列的多方会议通话系统,包括:

麦克风模块:用于收集声源的声音;

仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;

其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。

进一步地,所述四个方向形成对称关系。

进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。

进一步地,所述回声消除包括线性回声消除和非线性回声消除。

进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区之间相互隔离,每个音区只接收本音区内的音频信号。

第二方面,一种基于四麦阵列的多方会议通话方法,包括以下步骤:

接收麦克风阵列收集的不同方位声源的声音;

对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。

其中,所述麦克风阵列包括四个麦克风,所述四个麦克风分别位于四个不同方向。

进一步地,所述四个方向形成对称关系。

进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。

进一步地,所述回声消除包括线性回声消除和非线性回声消除。

进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区相互隔离,每个音区只接收本音区内的音频信号。

本发明的有益效果体现在:在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。

附图说明

为了更清楚地说明本发明

具体实施方式

或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

图1为实施例一提供的一种基于四麦阵列的多方会议通话系统的模块框图;

图2为实施例一提供的一种基于四麦阵列的多方会议通话系统的结构原理图;

图3为实施例二提供的一种基于四麦阵列的多方会议通话方法的流程图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。

需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

实施例一

如图1所示,一种基于四麦阵列的多方会议通话系统,包括麦克风模块和仿真处理模块,麦克风模块包括麦克风阵列,麦克风阵列由位于四个不同方向的四个麦克风组成,四个方向形成对称关系,麦克风模块用于通过四个麦克风对不同方位声源的声音进行收集,仿真处理模块用于通过波束形成、回声消除以及深度神经网络计算模型对收集到声源的声音进行仿真处理,如图2所示,生成0~90度、90~180度、180~270度以及270~360度四个音区,并输出四个音区的音频,从而得到不同方位说话人的实时音频。

具体地,麦克风模块包括了由四个麦克风组成的麦克风阵列,四个麦克风分别位于四个不同的方向,四个方向在空间上形成一种对称关系,麦克风模块通过四个麦克风对不同方位声源的声音进行收集,将收集到声源的声音通过仿真处理模块进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。

实施例二

如图3所示,一种基于四麦阵列的多方会议通话方法,包括以下步骤:

S1:接收麦克风阵列收集的不同方位声源的声音;

具体地,麦克风阵列由四个麦克风组成,四个麦克风分别位于四个不同的方向,四个方向在空间上构成对称关系,通过四个麦克风对不同方位声源的声音进行收集。

S2:对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。

具体地,对收集到不同方位声源的声音进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。

本发明在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:啸叫处理方法、装置、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类