一种有效抑制响应时间延迟的电子产品语音控制系统

文档序号：193367 发布日期：2021-11-02 浏览：29次 >En<

阅读说明：本技术 一种有效抑制响应时间延迟的电子产品语音控制系统 (Electronic product voice control system capable of effectively restraining response time delay ) 是由高媛于 2021-09-27 设计创作，主要内容包括：本发明公开了一种有效抑制响应时间延迟的电子产品语音控制系统,该语音控制系统旨在解决现有技术下响应延迟时间较长,通过语音操作电子产品所耗费的时间较长,降低了语音控制的实用性,使用不便,声纹识别的精度较低,容易发出与用户意图不符的指令的技术问题。该语音控制系统包括样本采集模块、语音采集模块、数模转换模块、存储模块、语音识别模块、控制模块和通信模块。该语音控制系统便于多个用户对电子产品的语音控制,通过语音识别模块对语音数据进行处理和判断,提高声纹比对的精度,使输出的指令与用户的目标指令匹配度更高,通过控制模块内预设的响应时间有效抑制响应时间延长的问题,缩短语音操作电子产品所耗费的时。(The invention discloses a voice control system of an electronic product for effectively inhibiting response time delay, which aims to solve the technical problems that the response delay time is longer, the time consumed by operating the electronic product through voice is longer, the practicability of voice control is reduced, the use is inconvenient, the accuracy of voiceprint recognition is lower, and an instruction which is not in accordance with the intention of a user is easy to send out in the prior art. The voice control system comprises a sample acquisition module, a voice acquisition module, a digital-to-analog conversion module, a storage module, a voice recognition module, a control module and a communication module. The voice control system is convenient for a plurality of users to control the voice of the electronic product, processes and judges voice data through the voice recognition module, improves the precision of voiceprint comparison, enables the matching degree of an output instruction and a target instruction of the user to be higher, effectively inhibits the problem of prolonging of response time through the response time preset in the control module, and shortens the time consumed by operating the electronic product by the voice.)

技术领域

本发明属于语音控制技术领域，具体涉及一种有效抑制响应时间延迟的电子产品语音控制系统。

背景技术

随着计算机技术的不断发展，电子产品在日常生活中得到广泛的使用，结合语音识别技术，可以通过语音控制电子产品进行相应的动作，进一步方便了电子产品的使用。

目前，专利号为CN201510989140.0的发明专利公开了语音控制装置，包括：语音采集模块，所述语音采集模块用于接收语音信号；语音识别模块，所述语音识别模块用于根据所述语音信号生成语音特征，以及根据所述语音控制装置的当前工作模式对所述语音特征进行判断，并在判断所述语音特征与所述当前工作模式对应的语音范本匹配时生成语音命令；第一通信模块，所述第一通信模块用于与智能终端进行无线通信；控制模块，所述控制模块用于根据所述语音命令生成控制指令，并通过所述第一无线通信模块将所述控制指令发送给所述智能终端，以使所述智能终端根据所述控制指令进行工作。其采用的是通过工作模块对语音特征进行判断，但该系统存在响应延迟时间较长，通过语音操作电子产品所耗费的时间较长，降低了语音控制的实用性，使用不便，声纹识别的精度较低，容易发出与用户意图不符的指令。

因此，针对上述电子产品中语音控制系统响应延迟时间长和声纹识别的精度较低的问题，亟需得到解决，以改善电子产品的使用场景。

发明内容

（1）要解决的技术问题

针对现有技术的不足，本发明的目的在于提供一种有效抑制响应时间延迟的电子产品语音控制系统，该语音控制系统旨在解决现有技术下响应延迟时间较长，通过语音操作电子产品所耗费的时间较长，降低了语音控制的实用性，使用不便，声纹识别的精度较低，容易发出与用户意图不符的指令的技术问题。

（2）技术方案

为了解决上述技术问题，本发明提供了这样一种有效抑制响应时间延迟的电子产品语音控制系统，该语音控制系统包括样本采集模块、语音采集模块、数模转换模块、存储模块、语音识别模块、控制模块和通信模块，

所述样本采集模块包括新建样本、录入语音、提取特征、模型训练，所述样本采集模块通过新建样本可建立多个用户，从而便于不同的用户向电子产品发出指令，所述录入语音用于采集用户的声音数据，录入语音录入的语音内容包括唤醒词和关键词，所述提取特征根据语音的特殊性和语音的稳定性从采集到的声音数据中提取出声音特征；

所述语音采集模块用于采集周围环境中发出的语音数据；

所述数模转换模块用于将采集到的模拟信号转化为便于处理的数字信号，并减少或削弱噪声影响，提高采集到的语音数据的精度，所述数模转换模块内预设有转化算法：将一个连续变化的信号x（t）转换成时间上离散的采样信号x（n），采样速率fs=2.5fmax，将采样输出所得的瞬时模拟信号保持一段时间，将连续幅度的抽样信号转换成离散时间、离散幅度的数字信号，量化误差，将量化后的信号编码成二进制代码输出；

所述存储模块包括指令库、模型库和文本库，所述指令库内为预设的用于操控电子产品完成相应操作的各项指令，指令由操作码和地址码组成，所述模型库内包含所有用户的个人声纹范本，所述文本库内包括预设的词语或句子；

所述语音识别模块内预设有指令对比规则：将得到的输入指令I与指令库k（I1、I2、I3……In）内的指令依次进行比对，首先进行第一次比对，I与I1进行比对，若I与I1的匹配度P1≥70%，结果中保留I1，若否，结果为0，然后进行第二次比对，I与I2进行比对，若P2＜70%，保留上一次结果不变，若I与I2的匹配度P2≥70%，结合上一次的结果，当上一次结果中保留I1时，若P1≤P2，结果中保留I2，否则保留I1，若前一个比对中，结果为0，结果中保留I2，直至I与指令库k中的所有指令比对结束，最终结果Ix作为最终指令的输出，若最终结果为0 ，则该条指令作无效处理；

所述控制模块用于指挥各个模块按照要求在指定时间内完成样本采集、语音采集、数模转换、存储、语音识别和通信工作；

所述通信模块用于将最终的指令发送给电子产品，从而使电子产品根据用户的语音作出相应的操作，所述控制模块内预设有响应时间。

使用本技术方案的语音控制系统时，首先语音采集模块采用用户的语音指令，数模转换模块将一个连续变化的信号x（t）转换成时间上离散的采样信号x（n），采样速率fs=2.5fmax，将采样输出所得的瞬时模拟信号保持一段时间，将连续幅度的抽样信号转换成离散时间、离散幅度的数字信号，量化误差，将量化后的信号编码成二进制代码输出，语音识别模块将得到的输入指令I与指令库k（I1、I2、I3……In）内的指令依次进行比对，首先进行第一次比对，I与I1进行比对，若I与I1的匹配度P1≥70%，结果中保留I1，若否，结果为0，然后进行第二次比对，I与I2进行比对，若P2＜70%，保留上一次结果不变，若I与I2的匹配度P2≥70%，结合上一次的结果，当上一次结果中保留I1时，若P1≤P2，结果中保留I2，否则保留I1，若前一个比对中，结果为0，结果中保留I2，直至I与指令库k中的所有指令比对结束，最终结果Ix作为最终指令的输出，若最终结果为0 ，则该条指令作无效处理，由控制模块将需要输出的指令经通信模块发送至电子产品，从而使电子产品执行响应的操作。

优选地，所述语音的特殊性包括音质、音长、音强和音高，所述模型训练根据声音特征来模拟说话人，建立专属于用户的个人声纹范本，所述样本采集模块可建立的用户最多为3个，分别为用户1、用户2和用户3。

优选地，所述语音采集模块内预设有语音录入结束判断规则：当超过1s没有采集到语音信息，语音采集模块判定为语音录入结束，当总采集时间大于15s时，语音采集模块自动停止语音录入操作。

优选地，所述语音识别模块包括声纹识别处理单元、文本转换处理单元、语义解析单元、指令比对单元，所述声纹识别处理单元将语音采集模块采集到的语音数据与模型库内的个人声纹范本进行比对，所述文本转换处理单元将语音数据转化为文本信息，所述语义解析单元对文本信息进行语义检查和处理，产生相应的目标指令，所述指令比对单元将语义解析单元产生的目标指令与指令库中的指令进行比对，判断语义解析单元产生的目标指令是否需要输出。

优选地，所述声纹识别处理单元内预设有识别算法：首先判断唤醒词是否正确，若否，则该条语音数据无效，若唤醒词正确，调取模型库内用户1的个人声纹范本，分别从音质、音长、音强和音高四个方面与语音采集模块采集到的唤醒词数据进行比对，若相似值超过95%，则判定该唤醒词数据属于用户1，若相似值低于95%，继续调取模型库内用户2的个人声纹范本进行比对，若相似值超过95%，则判定该唤醒词数据属于用户2，若相似值低于95%，继续调取模型库内用户3的个人声纹范本进行比对，若相似值超过95%，则判定该唤醒词数据属于用户3，若相似值低于95%，则判定该唤醒词数据无效，若唤醒词有效，调取模型库内用户1的个人声纹范本，分别从音质、音长、音强和音高四个方面与语音采集模块采集到的指令语音数据进行比对，若相似值超过95%，则判定该指令语音数据属于用户1，若相似值低于95%，继续调取模型库内用户2的个人声纹范本进行比对，若相似值超过95%，则判定该指令语音数据属于用户2，若相似值低于95%，继续调取模型库内用户3的个人声纹范本进行比对，若相似值超过95%，则判定该指令语音数据属于用户3，若相似值低于95%，则判定该指令语音数据无效。

优选地，所述文本转换处理单元根据所述存储模块内的文本库，将音频切割成帧语言，与文本库内的词组进行匹配，然后转化为文本数据。

优选地，所述语义解析单元包括文本预处理、文本特征提取和分类模型构建，所述文本预处理内预设有词典表，将句子拆分成多个部分，将每一个部分与词典表一一对应，如果该词语在词典表中，分词成功，否则继续拆分匹配直到成功。

优选地，所述控制模块内预设的响应时间包括唤醒词响应时间和语音对话响应时间，其中唤醒词响应时间为200ms-500ms，语音对话响应时间为650ms-1050ms。

（3）有益效果

与现有技术相比，本发明的有益效果在于：本发明的语音控制系统通过样本采集模块可录入多个用户的声音样本，从而便于多个用户对电子产品的语音控制，通过语音识别模块对语音数据进行处理和判断，提高声纹比对的精度，使输出的指令与用户的目标指令匹配度更高，通过控制模块内预设的响应时间有效抑制响应时间延长的问题，缩短语音操作电子产品所耗费的时间，提高了语音控制的实用性。

附图说明

为了更清楚的说明本发明

具体实施方式

或现有技术中的技术方案，下面将对具体实施方式或现有技术中描述所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一种实施方式，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明语音控制系统一种具体实施方式的整体框架结构示意图；

图2为本发明语音控制系统一种具体实施方式的样本采集模块框架结构示意图；

图3为本发明语音控制系统一种具体实施方式的语音识别模块框架结构示意图；

图4为本发明语音控制系统一种具体实施方式的存储模块框架结构示意图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面对本发明具体实施方式中的技术方案进行清楚、完整的描述，以进一步阐述本发明，显然，所描述的具体实施方式仅仅是本发明的一部分实施方式，而不是全部的样式。

实施例1

本具体实施方式是有效抑制响应时间延迟的电子产品语音控制系统，其整体框架结构示意图如图1所示，该语音控制系统包括样本采集模块、语音采集模块、数模转换模块、存储模块、语音识别模块、控制模块和通信模块，

样本采集模块包括新建样本、录入语音、提取特征、模型训练，样本采集模块通过新建样本可建立多个用户，从而便于不同的用户向电子产品发出指令，录入语音用于采集用户的声音数据，录入语音录入的语音内容包括唤醒词和关键词，提取特征根据语音的特殊性和语音的稳定性从采集到的声音数据中提取出声音特征；

语音采集模块用于采集周围环境中发出的语音数据；

数模转换模块用于将采集到的模拟信号转化为便于处理的数字信号，并减少或削弱噪声影响，提高采集到的语音数据的精度，数模转换模块内预设有转化算法：将一个连续变化的信号x（t）转换成时间上离散的采样信号x（n），采样速率fs=2.5fmax，将采样输出所得的瞬时模拟信号保持一段时间，将连续幅度的抽样信号转换成离散时间、离散幅度的数字信号，量化误差，将量化后的信号编码成二进制代码输出；

存储模块包括指令库、模型库和文本库，指令库内为预设的用于操控电子产品完成相应操作的各项指令，指令由操作码和地址码组成，模型库内包含所有用户的个人声纹范本，文本库内包括预设的词语或句子；

语音识别模块内预设有指令对比规则：将得到的输入指令I与指令库k（I1、I2、I3……In）内的指令依次进行比对，首先进行第一次比对，I与I1进行比对，若I与I1的匹配度P1≥70%，结果中保留I1，若否，结果为0，然后进行第二次比对，I与I2进行比对，若P2＜70%，保留上一次结果不变，若I与I2的匹配度P2≥70%，结合上一次的结果，当上一次结果中保留I1时，若P1≤P2，结果中保留I2，否则保留I1，若前一个比对中，结果为0，结果中保留I2，直至I与指令库k中的所有指令比对结束，最终结果Ix作为最终指令的输出，若最终结果为0 ，则该条指令作无效处理；

控制模块用于指挥各个模块按照要求在指定时间内完成样本采集、语音采集、数模转换、存储、语音识别和通信工作；

通信模块用于将最终的指令发送给电子产品，从而使电子产品根据用户的语音作出相应的操作，控制模块内预设有响应时间。

其中，语音的特殊性包括音质、音长、音强和音高，模型训练根据声音特征来模拟说话人，建立专属于用户的个人声纹范本，样本采集模块可建立的用户最多为3个，分别为用户1、用户2和用户3，语音采集模块内预设有语音录入结束判断规则：当超过1s没有采集到语音信息，语音采集模块判定为语音录入结束，当总采集时间大于15s时，语音采集模块自动停止语音录入操作，语音识别模块包括声纹识别处理单元、文本转换处理单元、语义解析单元、指令比对单元，声纹识别处理单元将语音采集模块采集到的语音数据与模型库内的个人声纹范本进行比对，文本转换处理单元将语音数据转化为文本信息，语义解析单元对文本信息进行语义检查和处理，产生相应的目标指令，指令比对单元将语义解析单元产生的目标指令与指令库中的指令进行比对，判断语义解析单元产生的目标指令是否需要输出。

同时，声纹识别处理单元内预设有识别算法：首先判断唤醒词是否正确，若否，则该条语音数据无效，若唤醒词正确，调取模型库内用户1的个人声纹范本，分别从音质、音长、音强和音高四个方面与语音采集模块采集到的唤醒词数据进行比对，若相似值超过95%，则判定该唤醒词数据属于用户1，若相似值低于95%，继续调取模型库内用户2的个人声纹范本进行比对，若相似值超过95%，则判定该唤醒词数据属于用户2，若相似值低于95%，继续调取模型库内用户3的个人声纹范本进行比对，若相似值超过95%，则判定该唤醒词数据属于用户3，若相似值低于95%，则判定该唤醒词数据无效，若唤醒词有效，调取模型库内用户1的个人声纹范本，分别从音质、音长、音强和音高四个方面与语音采集模块采集到的指令语音数据进行比对，若相似值超过95%，则判定该指令语音数据属于用户1，若相似值低于95%，继续调取模型库内用户2的个人声纹范本进行比对，若相似值超过95%，则判定该指令语音数据属于用户2，若相似值低于95%，继续调取模型库内用户3的个人声纹范本进行比对，若相似值超过95%，则判定该指令语音数据属于用户3，若相似值低于95%，则判定该指令语音数据无效。

另外，文本转换处理单元根据存储模块内的文本库，将音频切割成帧语言，与文本库内的词组进行匹配，然后转化为文本数据。

此外，语义解析单元包括文本预处理、文本特征提取和分类模型构建，文本预处理内预设有词典表，将句子拆分成多个部分，将每一个部分与词典表一一对应，如果该词语在词典表中，分词成功，否则继续拆分匹配直到成功，控制模块内预设的响应时间包括唤醒词响应时间和语音对话响应时间，其中唤醒词响应时间为200ms-500ms，语音对话响应时间为650ms-1050ms。

该语音控制系统的样本采集模块框架结构示意图如图2所示，其语音识别模块框架结构示意图如图3所示，其存储模块的框架结构示意图如图4所示。

以上描述了本发明的主要技术特征和基本原理及相关优点，对于本领域技术人员而言，显然本发明不限于上述示范性具体实施方式的细节，而且在不背离本发明的构思或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将上述具体实施方式看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外，应当理解，虽然本说明书按照各实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施方式中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：音频信号的比特分配方法和装置

一种有效抑制响应时间延迟的电子产品语音控制系统

相关技术

网友询问留言