一种基于无线分布式麦克风阵列的语音唤醒决策系统

文档序号:116986 发布日期:2021-10-19 浏览:37次 >En<

阅读说明:本技术 一种基于无线分布式麦克风阵列的语音唤醒决策系统 (Voice awakening decision-making system based on wireless distributed microphone array ) 是由 廖奎华 于 2021-03-31 设计创作,主要内容包括:本发明公开了一种基于无线分布式麦克风阵列的语音唤醒决策系统,具体涉及语音识别技术领域,包括微处理器、多个麦克风阵列和用于将麦克风阵列与控制中心连接的NB-iot模块,多个麦克风阵列采集语音信息通过NB-iot模块传输至控制中心进行处理,所述控制中心还连接有语音端点检测模块和信号处理模块,所述信号处理模块连接有声学特征提取模块,所述声学特征提取模块连接有识别解码模块。本发明能够获取更加全面的声音样本,并根据声音样本进行语音处理和分析,从而获取语音信息中的唤醒词,根据唤醒词匹配程度,完成唤醒决策内容,在常见的远场、噪音等复杂场景下,大大改善了智能语音设备的实际使用体验。(The invention discloses a voice awakening decision-making system based on a wireless distributed microphone array, and particularly relates to the technical field of voice recognition, wherein the voice awakening decision-making system comprises a microprocessor, a plurality of microphone arrays and an NB-iot module used for connecting the microphone arrays with a control center, voice information collected by the plurality of microphone arrays is transmitted to the control center for processing through the NB-iot module, the control center is further connected with a voice endpoint detection module and a signal processing module, the signal processing module is connected with an acoustic feature extraction module, and the acoustic feature extraction module is connected with a recognition decoding module. The method and the device can obtain more comprehensive sound samples, perform voice processing and analysis according to the sound samples so as to obtain the awakening words in the voice information, complete awakening decision content according to the awakening word matching degree, and greatly improve the actual use experience of the intelligent voice equipment under common complex scenes such as far fields, noises and the like.)

一种基于无线分布式麦克风阵列的语音唤醒决策系统

技术领域

本发明涉及语音识别技术领域,更具体地说,本发明涉及一种基于无线分布式麦克风阵列的语音唤醒决策系统。

背景技术

语音唤醒技术是语音识别领域中的一个重要分支,被广泛应用于手机终端、智能家居、车载导航等语音交互系统中,方便用户使用语音指令唤醒设备。更具体的,语音唤醒系统的任务是在后台不间断地从接收到的语音中自动检测出某个预先定义的唤醒词,一般也称为关键词检测,当系统检测到相应的关键词时,设备即被唤醒,并进入特定的工作状态。但是在常见的远场、噪音等复杂场景下,由于语音声音复杂,不能够获取全面的语音数据,并进行对比,从而造成过高的误拒率,会大大降低智能语音设备的实际使用体验。

发明内容

为了克服现有技术的上述缺陷,本发明的实施例提供一种基于无线分布式麦克风阵列的语音唤醒决策系统,通过设置分布式的语音获取设备,能够获取更加全面的声音样本,并根据声音样本进行语音处理和分析,从而获取语音信息中的唤醒词,根据唤醒词匹配程度,完成唤醒决策内容,在常见的远场、噪音等复杂场景下,大大改善了智能语音设备的实际使用体验。

为实现上述目的,本发明提供如下技术方案:一种基于无线分布式麦克风阵列的语音唤醒决策系统,包括微处理器、多个麦克风阵列和用于将麦克风阵列与控制中心连接的NB-iot模块,多个麦克风阵列采集语音信息通过NB-iot模块传输至控制中心进行处理,所述控制中心还连接有语音端点检测模块和信号处理模块,所述信号处理模块连接有声学特征提取模块,所述声学特征提取模块连接有识别解码模块,所述识别解码模块连接有唤醒词解析模块,所述唤醒词解析模块连接有唤醒决策模块。

在一个优选地实施方式中,所述麦克风阵列采用分布式排列方法设置于语音唤醒的场所。

在一个优选地实施方式中,所述NB-iot模块包括NB-iot上传模块、NB-iot微型基站和NB-iot下载模块,通过NB-iot技术实现对麦克风阵列的无线分布和数据传输。

在一个优选地实施方式中,所述语音端点检测模块对接收的音频信息进行高通滤波,并根据得到的音频数据进行语音端点检测,获取语音信息中的端点信息,根据端点信息过滤音频信息中的无效信息,所述语音端点检测模块还连接有处理模块,用于对端点检测后的语音信息进行存储和备份。

在一个优选地实施方式中,所述信号处理模块还与存储模块连接,从存储模块中调取端点检测后的语音信息,所述信号处理模块对语音信息进行二次处理,滤除处于两个语音端点内语音信息中的杂音和无效声音,并将声音信息分割为等量的声音帧段。

在一个优选地实施方式中,所述声学特征提取模块对声音帧段进行特征提取,所述识别解码模块对提取的特征进行解码分析,获取唤醒词信息,所述唤醒词解析模块对唤醒词信息进行解析,并根据解析后的相似度,利用唤醒决策模块进行唤醒决策,唤醒系统。

本发明的技术效果和优点:

本发明能够获取更加全面的声音样本,并根据声音样本进行语音处理和分析,从而获取语音信息中的唤醒词,根据唤醒词匹配程度,完成唤醒决策内容,在常见的远场、噪音等复杂场景下,大大改善了智能语音设备的实际使用体验,降低了唤醒的误拒率。

附图说明

图1为本发明的系统框架结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示的一种基于无线分布式麦克风阵列的语音唤醒决策系统,包括微处理器、多个麦克风阵列和用于将麦克风阵列与控制中心连接的NB-iot模块,多个麦克风阵列采集语音信息通过NB-iot模块传输至控制中心进行处理,所述控制中心还连接有语音端点检测模块和信号处理模块,所述信号处理模块连接有声学特征提取模块,所述声学特征提取模块连接有识别解码模块,所述识别解码模块连接有唤醒词解析模块,所述唤醒词解析模块连接有唤醒决策模块;

所述麦克风阵列采用分布式排列方法设置于语音唤醒的场所;

所述NB-iot模块包括NB-iot上传模块、NB-iot微型基站和NB-iot下载模块,通过NB-iot技术实现对麦克风阵列的无线分布和数据传输;

所述语音端点检测模块对接收的音频信息进行高通滤波,并根据得到的音频数据进行语音端点检测,获取语音信息中的端点信息,根据端点信息过滤音频信息中的无效信息,所述语音端点检测模块还连接有处理模块,用于对端点检测后的语音信息进行存储和备份;

所述信号处理模块还与存储模块连接,从存储模块中调取端点检测后的语音信息,所述信号处理模块对语音信息进行二次处理,滤除处于两个语音端点内语音信息中的杂音和无效声音,并将声音信息分割为等量的声音帧段;

所述声学特征提取模块对声音帧段进行特征提取,所述识别解码模块对提取的特征进行解码分析,获取唤醒词信息,所述唤醒词解析模块对唤醒词信息进行解析,并根据解析后的相似度,利用唤醒决策模块进行唤醒决策,唤醒系统;

在上述的基础上,声学特征提取模块对声音帧段进行特权提取时,会基于系统中预设的特征进行提取,进行特征对比,从而获取更加精确的声音特征;

而预设的特征可在系统运行的过程中,通过声音训练模型,训练生成预设的声音特征;

识别解码模块对获取的声音特征进行解析,而在存储模块中,存储有系统预设的唤醒词信息,识别解码模块在进行解析时,会将特征与存储模块中存储的信息进行比对,从而完成解析,获取唤醒词;

唤醒决策模块会将获取的唤醒词与预设的唤醒词进行匹配,根据匹配的相似度进行系统唤醒,在相似度大于95%完成系统唤醒。

最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;

其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;

最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种车辆语音交互系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!