一种会议语音数据采集方法及系统

文档序号：193361 发布日期：2021-11-02 浏览：33次 >En<

阅读说明：本技术 一种会议语音数据采集方法及系统 (Conference voice data acquisition method and system ) 是由王钰勋于 2021-09-03 设计创作，主要内容包括：本发明提出了一种会议语音数据采集方法及系统,涉及智能语音识别技术领域,包括：采集初始语音信息并转化为音频信号；通过滤波器消除所述音频信号中的无效语音信号从而得到有效语音信号；将所述有效语音信号进行模数转换后发送到语音信息处理模块得到处理后的语音信息；将所述处理后的语音信息通过时间区间分割为多段语音信息；提取所述多段语音信息的语音特征,并将所述语音特征相同的语音信息进行分类得到分类后的语音信息；将分类后的所述语音信息根据时间先后顺序排列后进行数模转换得到会议中每个人员的语音数据；本发明能提高会议采集语音信息的准确率,并能分辨参会人员的语音信息。(The invention provides a conference voice data acquisition method and a system, which relate to the technical field of intelligent voice recognition and comprise the following steps: collecting initial voice information and converting the initial voice information into an audio signal; eliminating invalid voice signals in the audio signals through a filter to obtain valid voice signals; the effective voice signal is subjected to analog-to-digital conversion and then is sent to a voice information processing module to obtain processed voice information; dividing the processed voice information into a plurality of sections of voice information through a time interval; extracting voice features of the multiple sections of voice information, and classifying the voice information with the same voice features to obtain classified voice information; arranging the classified voice information according to time sequence, and then performing digital-to-analog conversion to obtain voice data of each person in the conference; the invention can improve the accuracy of the conference for collecting the voice information and can distinguish the voice information of the participants.)

一种会议语音数据采集方法及系统

技术领域

本发明涉及智能语音识别技术领域，具体而言，涉及一种会议语音数据采集方法及系统。

背景技术

随着人工智能和通讯技术的发展和普及，越来越多的企业和用户采用音视频会议系统进行本地和多方的会议交流。音视频会议的应用不仅大大的降低了用户沟通成本和时间，提高了企业和用户的生产和工作效率；同时，音视频会议系统中，越来越多的图像和语音的人工智能算法被采用，如人脸识别、OCR、语音识别、声纹识别、角色分离、声源分离等，也进一步提高了数字化会议纪要的效率。

现有的会议系统中需要对会议对话进行语音的采集，涉及诸多语音相关技术。由于会议中说话人的语音采集质量、远场条件下频谱衰减、会议室大小的混响、扬声器声音被麦克风采集导致返回的声音有杂音等因素的影响，存在多个与会者同时发言时的语音混杂，以及其他环境噪音的影响,造成语音采集的正确率很难达到实用的效果。

发明内容

本发明的目的在于提供一种会议语音数据采集方法及系统，其能够提高会议系统中采集语音信息的准确率，并能具体分辨每个参会人员的语音信息。

本发明的实施例是这样实现的：

第一方面，本申请实施例提供一种会议语音数据采集方法，其包括如下步骤：

步骤S01、采集初始语音信息并转化为音频信号；

步骤S02、通过滤波器消除上述音频信号中的无效语音信号从而得到有效语音信号；

步骤S03、将上述有效语音信号进行模数转换后发送到语音信息处理模块得到处理后的语音信息；

步骤S04、将上述处理后的语音信息通过时间区间分割为多段语音信息；

步骤S05、提取上述多段语音信息的语音特征，并将上述语音特征相同的语音信息进行分类得到分类后的语音信息；

步骤S06、将分类后的上述语音信息根据时间先后顺序排列后进行数模转换得到会议中每个人员的语音数据。

本发明一种会议语音数据采集方法通过滤波器可以消除会议系统中的环境噪声等无效语音信号，然后将剩余的每个参会人员的语音信息作为有效语音信息进行区分，可以通过相同特征的语音信息进行分类，即将同一个人的语音信息分为一类，从而可以详细的分辨具体是哪个参会人员发出的语音信息，并通过时间区间和时间先后顺序进行排列转换从而可以清楚地分辨在会议中每个参会人员在哪个时间段发出了哪些语音信息。

在本发明的一些实施例中，上述无效语音信号包括环境噪音和时间长度大于预定时间阈值的空白语音信号。

在本发明的一些实施例中，上述有效语音信号包括上述初始语音信息中的人体语音信息。

在本发明的一些实施例中，上述人体语音信息包括会议中所有人员的语音信息。

在本发明的一些实施例中，上述步骤S03还包括将模数转换后的上述有效语音信号发送到外接存储单元。

第二方面，本申请实施例提供一种会议语音数据采集系统，其包括：

语音采集模块，用于采集会议人员的初始语音信息并转化为音频信号；

滤波器模块，用于消除上述音频信号中的无效语音信号从而得到有效语音信号；

模数转换模块，用于将上述有效语音信号转换为有效语音数字信号；

语音分割模块，用于将上述有效语音数字信号通过时间区间分割为多段语音信息；

语音提取模块，用于提取上述多段语音信息的语音特征，并将上述语音特征相同的语音信息进行分类；

数模转换模块，用于将分类后的上述语音信息转换为模拟信号完成语音数据的采集；

上述语音采集模块与上述滤波器模块、上述模数转换模块、上述语音分割模块、上述语音提取模块和上述数模转换模块依次连接。

在本发明的一些实施例中，上述模数转换模块与上述语音分割模块之间连接有语音信息处理模块，上述语音信息处理模块用于将上述有效语音数字信号进行数据处理从而提高信号处理速度。

在本发明的一些实施例中，上述语音信息处理模块连接有外接存储单元，上述外接存储单元用于对语音数据进行实时存储，方便日后进行管理。

在本发明的一些实施例中，上述语音提取模块与上述数模转换模块连接有语音排列模块，上述语音排列模块用于将分类后的上述语音信息根据时间先后顺序进行排列。

在本发明的一些实施例中，上述数模转换模块连接有功率放大模块，上述功率放大模块用于将转换后的上述模拟信号进行信号放大。

相对于现有技术，本发明的实施例至少具有如下优点或有益效果：

本申请发明提供一种会议语音数据采集方法及系统，其包括如下步骤：步骤S01、采集初始语音信息并转化为音频信号；步骤S02、通过滤波器消除上述音频信号中的无效语音信号从而得到有效语音信号；步骤S03、将上述有效语音信号进行模数转换后发送到语音信息处理模块得到处理后的语音信息；步骤S04、将上述处理后的语音信息通过时间区间分割为多段语音信息；步骤S05、提取上述多段语音信息的语音特征，并将上述语音特征相同的语音信息进行分类得到分类后的语音信息；步骤S06、将分类后的上述语音信息根据时间先后顺序排列后进行数模转换得到会议中每个人员的语音数据。

本发明一种会议语音数据采集方法及系统，通过滤波器可以消除会议系统中的环境噪声等无效语音信号，然后将剩余的每个参会人员的语音信息作为有效语音信息进行区分，可以通过相同特征的语音信息进行分类后详细的分辨具体是哪个参会人员发出的语音信息，并通过时间区间和时间先后顺序进行排列转换从而可以清楚地分辨在会议中每个参会人员在哪个时间段发出了哪些语音信息，从而大大的提高了会议系统中对参会人员语音信息采集的准确度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例1的一种会议语音数据采集方法的流程框图；

图2为本发明实施例2的一种会议语音数据采集系统的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

需要说明的是，在本文中，术语“包括”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本申请的描述中，还需要说明的是，除非另有明确的规定和限定，术语“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的各个实施例及实施例中的各个特征可以相互组合。

实施例1

请参阅图1，图1所示为本申请实施例提供的一种会议语音数据采集方法的流程框图。

一种会议语音采集方法，包括如下步骤：

步骤S01、采集初始语音信息并转化为音频信号；

步骤S02、通过滤波器消除音频信号中的无效语音信号从而得到有效语音信号；

步骤S03、将有效语音信号进行模数转换后发送到语音信息处理模块得到处理后的语音信息；

步骤S04、将处理后的语音信息通过时间区间分割为多段语音信息；

步骤S05、提取多段语音信息的语音特征，并将语音特征相同的语音信息进行分类得到分类后的语音信息；

步骤S06、将分类后的语音信息根据时间先后顺序排列后进行数模转换得到会议中每个人员的语音数据。

本申请的实施例1提供的一种会议语音数据采集方法，通过采用滤波器可以消除会议系统中的环境噪声等无效语音信号，然后将剩余的每个参会人员的语音信息作为有效语音信息进行区分，可以通过相同特征的语音信息进行分类，再详细的分辨具体是哪个参会人员发出的语音信息，然后通过时间区间和时间的先后顺序进行排列转换，从而可以清楚地分辨在会议中每个参会人员在哪个时间段发出了哪些语音信息，从而大大的提高了会议系统中对参会人员语音信息采集的准确度。

作为一种优选的实施方式，无效语音信号包括环境噪音和时间长度大于预定时间阈值的空白语音信号。

作为一种优选的实施方式，有效语音信号包括初始语音信息中的人体语音信息。

作为一种优选的实施方式，人体语音信息包括会议中所有人员的语音信息。

作为一种优选的实施方式，步骤S03还包括将模数转换后的有效语音信号发送到外接存储单元。

可以理解，图1所示的结构仅为示意，一种会议语音数据采集方法还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

实施例2

请参阅图2，图2所示为实施例2的一种会议语音数据采集系统的结构示意图。

一种会议语音数据采集系统，包括：

语音采集模块，用于采集会议人员的初始语音信息并转化为音频信号；

滤波器模块，用于消除音频信号中的无效语音信号从而得到有效语音信号；

模数转换模块，用于将有效语音信号转换为有效语音数字信号；

语音分割模块，用于将有效语音数字信号通过时间区间分割为多段语音信息；

语音提取模块，用于提取多段语音信息的语音特征，并将语音特征相同的语音信息进行分类；

数模转换模块，用于将分类后的语音信息转换为模拟信号完成语音数据的采集；

语音采集模块与滤波器模块连接，滤波器模块与模数转换模块连接、模数转换模块与语音分割模块连接，语音分割模块与语音提取模块连接，语音提取模块和数模转换模块连接。

本申请的实施例2提供的一种会议语音数据采集系统，首先通过语音采集模块采集到会议参会人员的初始语音信息，并将初始语音信息转化为音频信号，再通过滤波器模块进行音频信号的消除，把其中的无效语音信号(环境噪音和时间长度大于预定时间阈值的空白语音信号)消除掉后即可得到有效的语音信号(初始语音信息中的人体语音信息)，然后通过模数转换模块将有效语音信号转换为有效语音数字信号，再通过语音分割模块将所得到的有效语音数字信号进行分割，具体地，通过有效语音数字信号所产生的时间区间进行细细划分，即通过将每段有效语音数字信号进行时间编号，对同一时间段的有效语音数字信号进行分割，从而分割为多段具有时间编号的语音信息，再通过语音提取模块提取多段分割后的具有时间编号的语音信息的语音特征，并将语音特征相同的语音信息进行分类，从而可以将分类后的语音信息根据时间编号的前后顺序进行排列，最后通过数模转换模块将分类后的语音信息进行转换，即将分类后的数字语音信号转换为模拟语音信号，从而完成了会议中的语音数据的采集，精确的通过时间段区分了每个参会人员的语音，分辨出在会议中每个参会人员在哪个时间段发出了哪些语音信息，从而大大的提高了会议系统中对参会人员语音信息采集的准确度。

作为一种优选的实施方式，模数转换模块与语音分割模块之间连接有语音信息处理模块，语音信息处理模块用于将有效语音数字信号进行数据处理从而提高信号处理速度。

作为一种优选的实施方式，语音信息处理模块连接有外接存储单元，外接存储单元用于对语音数据进行实时存储，方便日后进行管理。

作为一种优选的实施方式，语音提取模块与数模转换模块连接有语音排列模块，语音排列模块用于将分类后的语音信息根据时间先后顺序进行排列。

作为一种优选的实施方式，数模转换模块连接有功率放大模块，功率放大模块用于将转换后的模拟信号进行信号放大。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

综上所述，本申请实施例提供的一种会议语音采集方法及系统，通过使用滤波器可以消除会议系统中的环境噪声等无效语音信号，然后将剩余的每个参会人员的语音信息作为有效语音信息进行区分，可以通过相同特征的语音信息进行分类，即将同一个人的语音信息分为一类，从而可以详细的分辨具体是哪个参会人员发出的语音信息，并通过时间区间和时间先后顺序进行排列转换从而可以清楚地分辨在会议中每个参会人员在哪个时间段发出了哪些语音信息，从而大大的提高了会议系统中对参会人员语音信息采集的准确度。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其它的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

9页详细技术资料下载

一种会议语音数据采集方法及系统

相关技术

网友询问留言