一种语音识别离线命令词唤醒应用方法与系统

文档序号:193337 发布日期:2021-11-02 浏览:24次 >En<

阅读说明:本技术 一种语音识别离线命令词唤醒应用方法与系统 (Voice recognition offline command word awakening application method and system ) 是由 鲁霖 鲁鹏飞 杜航 于 2021-07-21 设计创作,主要内容包括:本申请公开了一种语音识别离线命令词唤醒应用方法与系统,其包括预设离线命令词集,所述离线命令词集包括至少一个离线命令词;采集语音数据并进行缓存;对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功则对语音系统进行唤醒。本申请可根据需求灵活设置离线命令词集中的离线命令词的数量,从而便于对不同的语音系统进行唤醒,增加唤醒效果,尽量避免对多个语音系统同时进行唤醒,使对语音系统的唤醒更加具有指定性。(The application discloses a voice recognition offline command word awakening application method and system, which comprises a preset offline command word set, wherein the offline command word set comprises at least one offline command word; collecting voice data and caching; and matching the cached voice data with the offline command words in the offline command word set, and awakening the voice system if the matching is successful. The quantity of the off-line command words in the off-line command word set can be flexibly set according to requirements, so that different voice systems can be conveniently awakened, the awakening effect is increased, a plurality of voice systems are prevented from being awakened simultaneously as much as possible, and the awakening of the voice systems is enabled to be more indicative.)

一种语音识别离线命令词唤醒应用方法与系统

技术领域

本发明涉及语音唤醒领域,尤其是涉及一种语音识别离线命令词唤醒应用方法。

背景技术

目前,在日常生活中,语音唤醒的应用领域比较广泛,例如机器人、收集、可穿戴设备、智能家居与现在车辆等,很多带有语音识别功能的设备,都带有语音环形技术作为人机交互的一个手段,不同的产品会有不同的命令唤醒词。当用户需要唤醒设备时,需要说出特定的命令唤醒词,唤醒过程可以看做是一种小资源的关键词检索任务,其中小资源是指计算资源比较小和空间存储资源比较小。

相关技术中,语音识别离线命令词唤醒是指语音识别算法通过加载离线命令词,识别出算法所要识别处理的唤醒命令词;当有持续的语音数据输入到唤醒系统时,语音识别算法会依据离线命令词包含的离线命令词,不断从语音数据中检索出要识别的离线命令词。

针对上述中的相关技术,发明人认为存在有以下缺陷:随着语音唤醒技术的发展与应用,识别率更高的唤醒体验和识别命令词更多的唤醒需求成为技术发展与应用的现实需求,现有的唤醒系统中的离线命令词均为固定的离线命令词,使唤醒系统对离线命令词的识别较为固定,当多个语音系统同时存在时,导致会对多个语音系统进行唤醒,使对语音系统的唤醒较为麻烦。

发明内容

为了改善现有的唤醒系统中的离线命令词均为固定的离线命令词,当多个语音系统同时存在时,导致会对多个语音系统进行唤醒,使对语音系统的唤醒较为麻烦的问题,本申请提供一种语音识别离线命令词唤醒应用方法与系统。

本申请提供的一种语音识别离线命令词唤醒应用方法采用如下的技术方案:

一种语音识别离线命令词唤醒应用方法,预设离线命令词集,所述离线命令词集包括至少一个离线命令词;

采集语音数据并进行缓存;

对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功则对语音系统进行唤醒。

通过采用上述技术方案,初始状态时语音系统处于休眠状态,预设离线命令词集,命令词集内包括至少一个离线命令词,采集环境中的语音数据,并缓存对应的语音数据,对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功即可对语音系统进行唤醒,可根据需求灵活设置离线命令词集中的离线命令词的数量,从而便于对不同的语音系统进行唤醒,增加唤醒效果,尽量避免对多个语音系统同时进行唤醒,使对语音系统的唤醒更加具有指定性。

可选的,所述预设离线命令词集包括:

在内存的存储区域内保存离线命令词集;

所述离线命令词集为对应语音系统预设的或使用人自行添加的。

通过采用上述技术方案,当处于同一环境内的同一型号的语音系统的数量为单个时,可由系统内预设的离线唤醒词对语音系统进行唤醒,当处于同一环境内的同一型号的语音系统的数量为多个时,可通过不同的离线唤醒词对同一型号的不同的语音系统进行唤醒,也可通过相同的离线唤醒词对设置有相同离线唤醒词的语音系统同时进行唤醒。大大增加对语音系统进行唤醒的方式,使对语音系统的唤醒方式更加人性化。

可选的,所述采集语音数据并进行缓存包括:

采集所述语音数据;

对采集的所述语音数据进行降噪处理;

对经降噪处理后的所述语音数据进行缓存。

通过采用上述技术方案,采集语音数据,对采集的语音数据进行降噪处理,对经降噪处理后的语音数据进行缓存,使缓存的语音数据的背景噪声减少,识别度更好。

可选的,所述对缓存的所述语音数据与多个所述离线命令词进行匹配,匹配成功则对语音系统进行唤醒,包括;

逐项匹配所述离线命令词集中的离线命令词与所述语音数据,匹配成功则对语音系统进行唤醒;

或,

同时匹配所述离线命令词集中的离线命令词与所述语音数据,匹配成功则对语音系统进行唤醒。

通过采用上述技术方案,对缓存的语音数据与多个离线命令词进行匹配,匹配的方式有两种,包括逐项匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,或同时匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,当供唤醒系统运行的内存较少时,可采用逐项匹配的方式,减少对内存的占用,当供唤醒系统运行的内存较多时,可采用同时匹配的方式,增加匹配的速度。

可选的,所述逐项匹配所述离线命令词集中的离线命令词与所述语音数据,匹配成功则对语音系统进行唤醒,包括:

加载所述离线命令词集中的第一离线命令词;

预设匹配阈值;

对所述第一离线命令词与所述语音数据进行匹配生成匹配值;

若所述第一离线命令词的所述匹配值大于或等于所述匹配阈值,根据所述语音数据对语音系统进行唤醒;

若所述匹配值小于所述匹配阈值,则加载所述离线命令词集中的第二离线命令词,若所有的离线命令词的匹配值均小于所述匹配阈值,则清空缓存的所述语音数据,并缓存下一个语音数据。

通过采用上述技术方案,当采用逐项对语音数据进行匹配时,加载第一离线命令词,预设匹配阈值,对第一离线命令词与语音数据进行匹配生成匹配值;

若第一离线命令词的匹配值大于或等于匹配阈值,根据语音数据对语音系统进行唤醒,使对语音系统的唤醒;

若匹配值小于匹配阈值,则加载离线命令词集中的第二离线命令词,若所有的离线命令词的匹配值均小于匹配阈值,则清空缓存的语音数据,并缓存下一个语音数据,使对下一语音数据进行匹配,使离线命令词能与对应的语音数据进行匹配。

可选的,所述根据所述语音数据对语音系统进行唤醒之后,还包括:

判断唤醒所述语音系统的离线唤醒命令词是否为所述第一离线命令词;

若是,则不更新所述离线命令词集中离线命令词的顺位;

若否,则将所述离线唤醒命令词设置为第一顺位,将所述第一离线命令词的顺位调为第二顺位,其他离线命令词均顺位后移。

通过采用上述技术方案,当对语音系统进行环形后,判断唤醒语音系统的离线唤醒命令词是否为第一离线命令词;

若是,则不更新离线命令词集中离线命令词的顺位;

若否,则将离线唤醒命令词设置为第一顺位,将第一离线命令词的顺位调为第二顺位,其他离线命令词均顺位后移,减少下一次唤醒过程中的判断时间,增加识别效率与唤醒效率。

可选的,所述同时匹配所述离线命令词集中的离线命令词与所述语音数据,匹配成功则对语音系统进行唤醒,包括:

同时加载所述离线命令词集中的所有离线命令词;

将所有离线命令词与所述语音数据同时进行匹配,生成多个不同的匹配值;

将多个不同的所述匹配值分别与对应的匹配阈值进行对比;

若都小于对应的匹配阈值,则匹配不成功,则清空缓存的所述语音数据,并缓存下一个语音数据;

若存在一个匹配值大于或等于对应的匹配阈值,则根据所述语音数据对语音系统进行唤醒。

通过采用上述技术方案,同时匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,包括:同时加载离线命令词集中的所有离线命令词;将所有离线命令词与语音数据同时进行匹配,生成多个不同的匹配值;将多个不同的匹配值分别与对应的匹配阈值进行对比;若都小于对应的匹配阈值,则匹配不成功,则清空缓存的语音数据,并缓存下一个语音数据;若存在一个匹配值大于或等于对应的匹配阈值,则根据语音数据对语音系统进行唤醒,使对语音系统的唤醒过程速度更快,增加对语音系统唤醒的效率。

一种语音识别离线命令词唤醒应用系统,包括:供电模块、语音数据暂存模块、离线命令词存放模块与处理模块;

所述处理模块,用于对比所述语音数据与所述离线命令词;

所述语音数据缓存模块,用于对所述语音数据进行缓存;

所述离线命令词存放模块,用于存储离线命令词集,离线命令词集内包括至少一个离线命令词;

所述供电模块,用于对所述处理模块、所述语音数据暂存模块与所述离线命令词存放模块进行供电。

通过采用上述技术方案,供电模块对处理模块,语音数据暂存模块与离线命令词存放模块进行供电,语音数据缓存模块对语音数据进行采集、降噪,并将降噪完毕的语音数据进行缓存,离线命令词存放模块存放离线命令词集,并可将离线命令词集内的离线命令词集进行增删与排序,处理模块调用语音数据暂存模块中的语音数据与离线命令词存放模块中的离线命令词集,对语音数据与离线命令词进行对比,从而决定能否对语音系统进行唤醒。

综上所述,本申请包括以下至少一种有益技术效果:

1.初始状态时语音系统处于休眠状态,预设离线命令词集,命令词集内包括至少一个离线命令词,采集环境中的语音数据,并缓存对应的语音数据,对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功即可对语音系统进行唤醒,可根据需求灵活设置离线命令词集中的离线命令词的数量,从而便于对不同的语音系统进行唤醒,增加唤醒效果;

2.对缓存的语音数据与多个离线命令词进行匹配,匹配的方式有两种,包括逐项匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,或同时匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,当供唤醒系统运行的内存较少时,可采用逐项匹配的方式,减少对内存的占用,当供唤醒系统运行的内存较多时,可采用同时匹配的方式,增加匹配的速度;

3.同时加载离线命令词集中的所有离线命令词;将所有离线命令词与语音数据同时进行匹配,生成多个不同的匹配值;将多个不同的匹配值分别与对应的匹配阈值进行对比;若都小于对应的匹配阈值,则匹配不成功,则清空缓存的语音数据,并缓存下一个语音数据;若存在一个匹配值大于对应的匹配阈值,则根据语音数据对语音系统进行唤醒,使对语音系统的唤醒过程速度更快,增加对语音系统唤醒的效率。

附图说明

图1是本申请其中一实施例的语音识别离线命令词唤醒应用方法的流程示意图;

图2是本身请其中一实施例的采集语音数据并进行缓存的流程示意图;

图3是本身请其中一实施例的逐项匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒的流程示意图;

图4是本身请其中一实施例的根据语音数据对语音系统进行唤醒之后的流程示意图;

图5是本身请其中一实施例的同时匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒的流程示意图。

具体实施方式

以下结合附图1-5对本申请作进一步详细说明。

本申请实施例公开一种语音识别离线命令词唤醒应用方法。

参照图1,该方法包括:

S1000、预设离线命令词集,离线命令词集包括至少一个离线命令词。

其中,离线命令词集内包括至少一个离线命令词,离线命令词的数量根据语音系统的数量来确定,离线命令词集内可设置公共的离线命令词也可设置专属的私有化离线命令词,例如,当同一环境中当需对多个语音系统同时进行唤醒,可在多个离线命令词集内设置相同的公共的离线命令词,可通过公共的离线命令词同时对不同的语音系统进行唤醒,也可自由的选择专属的私有化的离线命令词,来对使用者自身专属的语音系统进行唤醒。

S2000、采集语音数据并进行缓存。

其中,采集的语音数据为自然环境中的语音数据,包含有不同的语种、同种语种下的不同的方言等语音数据,使能各种不同的语音数据进行采集并缓存,且对语音数据进行缓存的时间可相对自由地进行设置,用于唤醒的语音数据通常词汇较少使语音的时长较短,例如可设置为较短的1秒,较为适中的两秒,还可设置为较长的3秒,语音数据即为人在短时间内能说清楚的特定语句。

S3000、对缓存的语音数据与离线命令词集中的离线命令词进行匹配,匹配成功则对语音系统进行唤醒。

其中,处于初始状态时,语音系统处于休眠状态,休眠状态的语音系统不接受外界语音,将语音数据与离线命令词集中的离线命令词进行匹配,为通过语音识别算法将语音数据进行识别,识别完成后与离线命令词集进行匹配,若匹配成功则对语音系统进行唤醒,使语音系统能接受外界语音并进行语音识别。

本实施例的实施原理为:

初始状态时语音系统处于休眠状态,预设离线命令词集,命令词集内包括至少一个离线命令词,采集环境中的语音数据,并缓存对应的语音数据,对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功即可对语音系统进行唤醒,可根据需求灵活设置离线命令词集内包含的离线命令词的数量,从而便于对不同的语音系统进行唤醒,增加唤醒效果。

在图1所示实施例的步骤S1000中,为了使离线命令词集中的离线命令词能合理地进行设置。

在内存的存储区域内保存离线命令词集,离线命令词集内包含有多个离线命令词,使离线命令词集在内存内运行。

其中,离线命令词集为语音系统预设的或使用人自行添加的,离线命令词集为语音系统,即内存对应语音系统预设有离线命令词,对应不同的语音系统的不同内存预设的离线命令词都为相同的离线命令词,也可以对内存内预设的离线命令词进行删减,同时还可对预设的离线命令词进行还原;

当离线命令词集内的离线命令词为使用人自行添加的,可针对不同的内存或不同的语音系统自行添加个性化的离线命令词,使个性化的离线命令词能针对单独的语音系统进行环形,减少对其他语音系统的影响,例如,系统内预设的离线命令词可为‘你好我的设备’,而个性化的离线命令词可为‘同学开个机’或者是‘给通个电’等等,由个人的兴趣喜好来对个性化的离线命令词进行设置。

在图1所示实施例的步骤S2000中,为了采集环境中的语音生成可与离线命令词集中的离线命令词进行匹配的语音数据;

参照图2,采集语音数据并进行缓存,包括如下步骤:

S2100、采集语音数据。

其中,采集的语音数据包括环境中的使用人说的话语,话语的类型包括不同的语言,不同的语言中还包括不同的类型的口音,例如,汉语中包括不同地域的方言,美式英语中还包括美式俚语等,当使用人说普通话带有方言口音,也可进行对其进行采集。

S2200、对采集的语音数据进行降噪处理。

对采集的语音数据进行降噪处理。

其中,包括对采集的语音进行背景环境降噪与语音识别;对采集的语音进行降噪可采用深度神经网络对采集的语音进行降噪,也可采用传统信号处理的方式进行降噪;

通过对深度神经网络降噪前对深度神经网络识别模型进行足够量的训练,通常用于离线唤醒的语音数据的数据量较小,便于进行足够的训练来对语音进行降噪,采用深度学习的方法对不同场景下的不同的语音进行降噪,且能在识别过程中对采集的语音数据进行语音增强、语音分离、回声消除等,使在不同的场景下能对不同的语音数据进行识别。

S2300、对经降噪处理后的语音数据进行缓存。

其中,语音数据缓存于闪存内,缓存时间较短,超过缓存时间则进行清除并重新缓存新的语音数据,使能对不同的语音数据进行缓存,缓存的语音数据的时间长度通常为对应采集的语音数据的时间长度,为了减少识别语音数据的时间,缓存的语音数据通常为1~3秒,2秒为较好的时间。

本申请实施例采集语音数据并进行缓存的实施原理为:对语音数据进行采集,采集对象包括环境中的使用人说的话语,话语的类型包括不同的语言,不同的语言中还包括不同的类型的口音,采集完成后对采集的语音数据进行背景环境降噪与语音识别,采用深度神经网络对语音数据进行降噪与识别,识别完成后对语音数据进行缓存,缓存时间较短,缓存的时间对应语音数据的时间长度。

在图1所示的步骤S3000中,对降噪与缓存的语音数据与离线命令词进行匹配,匹配成功则对语音系统进行唤醒,匹配失败则不对语音系统进行唤醒,语音系统仍保持初始的休眠状态,具体的匹配过程通过如下步骤来进行。

参照图3,对缓存的语音数据与多个离线命令词进行匹配,匹配成功则对语音系统进行唤醒,包括两种匹配方式,分别针对系统运行内存的大小来对语音系统进行唤醒。

逐项匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒;在该匹配方式中,通过将语音数据分别与每一项语音数据进行匹配,使对语音数据的匹配为单线程匹配,若匹配成功则对语音系统进行唤醒。

逐项匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,包括如下步骤:

S3101、加载离线命令词集中的第一离线命令词。

其中,将离线命令词集中的多个离线命令词随机进行排序,第一个与语音数据进行匹配的离线命令词为第一离线命令词,通过对第一离线命令词进行加载,使第一离线命令词首先开始与语音数据进行匹配。

S3102、预设匹配阈值;

其中,匹配阈值为离线命令词与语音数据匹配之间的相同点的,语音数据中的特征与离线命令词的特征的相同点越多,即为语音数据与离线命令词之间的相似度越高,例如设置语音数据与离线命令词的相似度达到或超过90%时,则默认语音数据为用于唤醒语音系统的语音数据,语音数据能对语音系统进行唤醒,匹配阈值即为90%,低于该匹配阈值则该语音数据不为唤醒语音系统的语音数据。

S3103、对第一离线命令词与语音数据进行匹配生成匹配值。

其中,将离线命令词集中的多个离线命令词随机进行排序,第一个与语音数据进行匹配的离线命令词为第一离线命令词,并按照随机顺序将离线命令词集内的多个离线命令词进行排序,从第一离线命令词开始依次进行加载,使离线命令词集内的离线命令词分别与语音数据进行匹配,离线命令词与语音数据进行匹配的过程即为离线命令词与语音数据的对比过程,对比相似度越高,离线命令词的匹配值越高,当匹配值大于或等于匹配阈值时,即对语音系统进行唤醒。

S3104、若第一离线命令词的匹配值大于或等于匹配阈值,根据语音数据对语音系统进行唤醒,并清空缓存的语音数据。

其中,当第一离线命令词与语音数据之间的匹配值小于匹配阈值时,第一离线命令词后的多个离线命令词按照排序后的顺序依次与语音数据进行匹配,若其中一个离线命令词的匹配值大于或等于匹配阈值则对语音系统进行唤醒。

S3105、若匹配值小于匹配阈值,则加载离线命令词集中的第二离线命令词,若所有的离线命令词的匹配值均小于匹配阈值,则清空缓存的语音数据,并缓存下一个语音数据。

其中、若所有离线命令词与该段缓存的离线命令词的匹配值均小于匹配阈值,则代表该段语音数据不为用于唤醒语音系统的离线数据,即对该段语音数据进行清除,并缓存下一段语音数据,用下一段语音数据再度分别与离线命令词集中的离线命令词进行匹配。

本实施例的实施原理为:将离线命令词集中的多个离线命令词随机进行排序,第一个与语音数据进行匹配的离线命令词为第一离线命令词,并按照随机顺序将离线命令词集内的多个离线命令词进行排序,从第一离线命令词开始依次进行加载,使离线命令词集内的离线命令词分别与语音数据进行匹配,其中一个离线命令词与语音数据的匹配值超过匹配阈值即可唤醒语音系统,逐个与语音数据进行匹配的过程中减少对内存的占用,满足多种场景的复合唤醒需求,能高效运用系统资源,有益于将语音唤醒作为人机互动入口却系统资源有限的智能设备的正常运行,减少卡顿的产生。

参照图4,根据语音数据对语音系统进行唤醒之后,还包括如下步骤:

S3111、判断唤醒语音系统的离线唤醒命令词是否为第一离线命令词。

其中,对语音系统进行初次唤醒后,判断唤醒语音系统的离线命令词是否为第一离线命令词,使便于后续对离线命令词进行排序。

S3112、若是,则不更新离线命令词集中离线命令词的顺位。

其中,若唤醒语音系统的离线命令词为第一离线命令词,则不对离线命令词集中的离线命令词的顺位进行更新,通常第一离线命令词为使用人惯用的离线命令词,减少离线命令词与语音数据的匹配过程,加快匹配速度。

S3113、若否,则将离线唤醒命令词设置为第一顺位,将第一离线命令词的顺位调为第二顺位,其他离线命令词均顺位后移。

其中,当唤醒离线语音系统的离线命令词不为第一离线命令词时,将原有第一离线命令词调为第二顺位,将唤醒语音系统的该离线命令词调为第一顺位,其他离线命令词均顺位后移,通常来说处于前面顺位的离线命令词为使用人的惯用的离线命令词,使对离线命令词的顺序进行优化,进一步加快对语音系统的唤醒过程。

本实施例的实施原理为:通过对唤醒语音系统的离线命令词在离线命令词集内的顺序的优化,使惯用的离线命令词处于第一顺位与前置的顺位,减少离线命令词集内的离线命令词与语音数据的匹配的次数,增加唤醒的性能。

或,

参照图5,同时匹配离线命令词集中的离线命令词与语音数据,匹配成功则对语音系统进行唤醒,包括如下步骤:

S3210、同时加载离线命令词集中的所有离线命令词。

其中,当内存的使用较为充足时,可同时对离线命令词集中的所有离线命令词同时进行加载,增加离线命令词的加载速度。

S3220、将所有离线命令词与语音数据同时进行匹配,生成多个不同的匹配值。

其中,对所有的离线命令词同时与语音数据进行匹配,且同时生成多个不同的匹配值,增加匹配的速度,减少匹配的时间。

S3230、将多个不同的匹配值分别与对应的匹配阈值进行对比。

其中,将多个不同的匹配值分别与对应的匹配阈值进行对比过程减少对比的时间,增加对比的效率。

S3240、若都小于对应的匹配阈值,则匹配不成功,则清空缓存的语音数据,并缓存下一个语音数据;

其中,若匹配值均小于匹配阈值时,匹配不成功,代表缓存的语音数据不为用于唤醒语音系统的语音数据,则对该语音数据进行清除,并缓存下一语音数据。

S3250、若存在一个匹配值大于或等于对应的匹配阈值,则根据语音数据对语音系统进行唤醒,且唤醒完成后将语音数据进行清除。

其中,若只要一个语音数据的匹配值大于或等于匹配阈值,即可对语音系统进行唤醒,使对语音系统的唤醒效率更高。

本实施例的实施原理为:当内存的使用较为充足时,同时将所有的离线命令词与语音数据进行匹配生成多个匹配值,只要有一个匹配值大于或等于匹配阈值即可对语音系统进行唤醒,增加唤醒的效率,减少对语音唤醒的时间。

实施例二:

一种语音识别离线命令词唤醒应用系统,包括:供电模块、语音数据暂存模块、离线命令词存放模块与处理模块;

处理模块,用于对比语音数据与离线命令词;

处理模块为处理芯片,处理芯片中运行有对比程序,对调用的语音数据与离线命令词进行对比,处理芯片中设置有ADC数据采集子模块,用于语音数据与离线命令词分别进行采集与调用。

语音数据缓存模块,用于对语音数据进行缓存;

语音数据缓存模块包括麦克风阵列、flash闪存与蓝牙芯片,flash将语音数据进行缓存,麦克风阵列内设置有语音降噪与语音识别算法,麦克风阵列将语音数据进行收集并对语音数据进行降噪处理,当同时刻多个命令词需要被查找识别时,麦克风阵列会选取一个时间点作为起始时间,并开始在flash内缓存2秒的语音数据,使缓存至flash内的语音数据的特征较为突出,便于与离线命令词进行匹配,麦克风阵列为常开状态,使能长时间对语音数据进行收集,蓝牙芯片用于语音数据的传输,使语音数据便于进行调用。

离线命令词存放模块,用于存储离线命令词集,离线命令词集内包括至少一个离线命令词;

离线命令词存放模块为RAM随机存取存储器,即系统内存,离线命令词为集存放于RAM内的一个较小的数据库,可对离线命令词集内的离线命令词进行调用或者改变不同的离线命令词的顺位。

供电模块,用于对处理模块、语音数据暂存模块与离线命令词存放模块进行供电,供电模块可进行有线供电,即可连接电网进行供电,供电模块还可为电池供电,电池供电为可进行充放电的锂电池供电。

本申请实施例一种语音识别离线命令词唤醒应用系统的实施原理为:供电模块对处理模块,语音数据暂存模块与离线命令词存放模块进行供电,语音数据缓存模块对语音数据进行采集、降噪,并将降噪完毕的语音数据进行缓存,离线命令词存放模块存放离线命令词集,并可将离线命令词集内的离线命令词集进行增删与排序,处理模块调用语音数据暂存模块中的语音数据与离线命令词存放模块中的离线命令词集,对语音数据与离线命令词进行对比,从而决定能否对语音系统进行唤醒。

以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:通过语音方式控制程序的方法、设备及程序产品

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!