语音识别和设定方法、装置、计算机设备和存储介质

文档序号：1743436 发布日期：2019-11-26 浏览：30次 >En<

阅读说明：本技术 语音识别和设定方法、装置、计算机设备和存储介质 (Speech recognition and setting method, device, computer equipment and storage medium ) 是由禤汉宁于 2019-08-12 设计创作，主要内容包括：本申请涉及一种语音识别和设定方法、装置、计算机设备和存储介质。方法包括：将唤醒词语音进行特征提取,得到唤醒词特征信息；将唤醒词特征信息与唤醒词数据库进行匹配；若匹配成功,则获取是否继续匹配唤醒词信号；否则,输出唤醒词匹配失败信号并继续获取唤醒词语音；若获取到继续匹配唤醒词信号,则重复获取唤醒词语音；若获取到停止继续匹配唤醒词信号,获取命令词语音；将命令词语音进行特征提取,得到命令词特征信息；将命令词特征信息与命令词数据库进行匹配；若匹配成功,则获取是否继续匹配命令词信号；否则,输出命令词匹配失败信号并继续获取命令词语音；若获取到继续匹配命令词信号,则重复获取命令词语音。(This application involves a kind of speech recognitions and setting method, device, computer equipment and storage medium.Method includes: that will wake up word sound to carry out feature extraction, obtains waking up word characteristic information；Word characteristic information will be waken up to match with word database is waken up；If successful match, obtains and whether continue matching wake-up word signal；Otherwise, output, which wakes up word it fails to match signal and continues to obtain, wakes up word sound；Word signal is waken up if getting and continuing matching, repeats to obtain wake-up word sound；Word signal is waken up if getting stopping and continuing matching, obtains order word sound；Order word sound is subjected to feature extraction, obtains order word characteristic information；Order word characteristic information is matched with order word database；If successful match, obtains and whether continue to match order word signal；Otherwise, output order word it fails to match signal and continue to obtain order word sound；Continue to match order word signal if getting, repeats to obtain order word sound.)

技术领域

本申请涉及智能语音技术领域，特别是涉及一种语音识别和设定方法、装置、计算机设备和存储介质。

背景技术

随着智能家居、智能电器的发展，出现了智能语音识别技术。智能语音识别技术是一种将数字语音转换为计算机可以理解的文字的技术。在智能通信系统中，智能语音接口正在把电器从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”；使用电器与通信网络，人们可以通过语音命令方便地从数据库系统中查询与提取有关的信息。随着计算机的小型化，键盘已经成为移动平台的一个很大障碍。语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

然而，目前的语音识别方法是将唤醒词和命令词输入到语音识别的设备上，用户通过说出唤醒词来开启智能设备，通过命令词来命令该智能设备具体工作。但是，传统的语音识别方法使得用户需要在同一空间内对多个智能语音设备中的一个进行语音操作时，会同时误启动或误操作其他智能语音设备。

发明内容

基于此，有必要针对用户需要在同一空间内对多个智能语音设备中的一个进行语音操作时，会同时误启动或误操作其他智能语音设备的技术问题，提供一种语音识别和设定方法、装置、计算机设备和存储介质。

一种语音识别和设定方法，所述方法包括：

获取唤醒词语音；

将所述唤醒词语音进行特征提取，得到唤醒词特征信息；

将所述唤醒词特征信息与唤醒词数据库进行匹配；

若匹配成功，则获取是否继续匹配唤醒词信号；

否则，输出唤醒词匹配失败信号并继续获取唤醒词语音；

若获取到继续匹配唤醒词信号，则重复获取唤醒词语音；

若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音；

将所述命令词语音进行特征提取，得到命令词特征信息；

将所述命令词特征信息与命令词数据库进行匹配；

若匹配成功，则获取是否继续匹配命令词信号；

否则，输出命令词匹配失败信号并继续获取命令词语音；

若获取到继续匹配命令词信号，则重复获取命令词语音；

若获取到停止继续匹配唤醒词信号，则输出命令词设定结束信号。

在其中一个实施例中，所述唤醒词特征信息包括唤醒词语种信息，所述唤醒词数据库包括唤醒词语种数据库，所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括：

将所述唤醒词语种信息与所述唤醒词语种数据库进行匹配，得到匹配结果。

在其中一个实施例中，所述唤醒词特征信息还包括唤醒词文字信息，所述唤醒词数据库还包括唤醒词文字数据库，所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括：

将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配，若所述唤醒词文字信息与所述唤醒词文字数据库匹配成功并且所述唤醒词语种信息与所述唤醒词语种数据库进行匹配成功，则唤醒词特征信息与唤醒词数据库匹配成功，否则唤醒词特征信息与唤醒词数据库匹配失败。

在其中一个实施例中，所述命令词特征信息包括命令词语种信息，所述命令词数据库包括命令词语种数据库，所述将命令词特征信息与命令词数据库进行匹配的步骤包括：

将所述命令词语种信息与所述命令词语种数据库进行匹配，得到匹配结果。

在其中一个实施例中，所述命令词特征信息还包括命令词文字信息，所述命令词数据库还包括命令词文字数据库，所述将命令词特征信息与命令词数据库进行匹配的步骤包括：

将所述命令词文字信息与所述命令词文字数据库进行匹配，若所述命令词文字信息与所述命令词文字数据库匹配成功并且所述命令词语种信息与所述命令词语种数据库进行匹配成功，则命令词特征信息与命令词数据库匹配成功，否则命令词特征信息与命令词数据库匹配失败。

在其中一个实施例中，所述唤醒词文字数据库包括唤醒词声学模型、多个预设唤醒文字和预设唤醒词组；所述将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配的步骤包括：根据所述唤醒词声学模型将所述唤醒词文字信息拆分为唤醒词音节，根据所述预设唤醒文字将每一所述唤醒词音节转化为唤醒词文字，根据接收到的所述唤醒词文字信息的顺序对所述唤醒词文字进行排序得到对比唤醒词组，将所述对比唤醒词组与所述预设唤醒词组进行匹配。

在其中一个实施例中，所述命令词文字数据库包括命令词声学模型、多个预设命令文字和预设命令词组；所述将所述命令词文字信息与所述命令词文字数据库进行匹配的步骤包括：根据所述命令词声学模型将所述命令词文字信息拆分为命令词音节，根据所述预设命令文字将每一所述命令词音节转化为命令词文字，根据接收到的所述命令词文字信息的顺序对所述命令词文字进行排序得到对比命令词组，将所述对比命令词组与所述预设命令词组进行匹配。

一种语音识别和设定装置，所述装置包括：

语音接收模块，用于接收唤醒词语音和命令词语音；

指令接收模块，用于接收是否继续匹配唤醒词信号和是否继续匹配命令词信号；

特征提取模块，用于从所述唤醒词语音中提取到唤醒词特征信息，从所述命令词语音中提取到命令词特征信息；

匹配模块，用于将所述唤醒词特征信息与唤醒词数据库进行匹配，用于将所述命令词特征信息与命令词数据库进行匹配；

输出模块，用于输出唤醒词匹配失败信号、唤醒词匹配结束信号、输出命令词设定结束信号以及命令词匹配失败信号。

一种智能语音设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取唤醒词语音；

将所述唤醒词语音进行特征提取，得到唤醒词特征信息；

将所述唤醒词特征信息与唤醒词数据库进行匹配；

若匹配成功，则获取是否继续匹配唤醒词信号；

否则，输出唤醒词匹配失败信号并继续获取唤醒词语音；

若获取到继续匹配唤醒词信号，则重复获取唤醒词语音；

若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音；

将所述命令词语音进行特征提取，得到命令词特征信息；

将所述命令词特征信息与命令词数据库进行匹配；

若匹配成功，则获取是否继续匹配命令词信号；

否则，输出命令词匹配失败信号并继续获取命令词语音；

若获取到继续匹配命令词信号，则重复获取命令词语音；

若获取到停止继续匹配唤醒词信号，则输出命令词设定结束信号。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取唤醒词语音；

将所述唤醒词语音进行特征提取，得到唤醒词特征信息；

将所述唤醒词特征信息与唤醒词数据库进行匹配；

若匹配成功，则获取是否继续匹配唤醒词信号；

否则，输出唤醒词匹配失败信号并继续获取唤醒词语音；

若获取到继续匹配唤醒词信号，则重复获取唤醒词语音；

若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音；

将所述命令词语音进行特征提取，得到命令词特征信息；

将所述命令词特征信息与命令词数据库进行匹配；

若匹配成功，则获取是否继续匹配命令词信号；

否则，输出命令词匹配失败信号并继续获取命令词语音；

若获取到继续匹配命令词信号，则重复获取命令词语音；

若获取到停止继续匹配唤醒词信号，则输出命令词设定结束信号。

上述语音识别和设定方法、装置、计算机设备和存储介质，通过获取多个唤醒词语音来设定多个不同的唤醒词，通过获取多个命令词来设定多个不同的命令词。使得用户需要在同一空间内对多个智能语音设备中的一个进行语音操作时，不会干扰其他智能语音设备工作。

附图说明

图1为一个实施例中语音识别和设定方法的应用环境图；

图2为一个实施例中语音识别和设定方法的流程示意图；

图3为一个实施例中唤醒词特征信息匹配步骤的流程示意图；

图4为一个实施例中命令词特征信息匹配步骤的流程示意图；

图5为一个实施例中语音识别和设定装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的语音识别和设定方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。其中，终端102可以但不限于是各种智能语音设备、个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种语音识别和设定方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：

步骤101：获取唤醒词语音。

其中，唤醒词为终端102的启动和关闭的指示性词汇。唤醒词语音是外界发送到终端102的关于唤醒词的语音。

具体地，终端102获取外界发送过来的唤醒词语音。需要说明的是，外界发送过来的唤醒词用于与数据库中的唤醒词相匹配。如果外界发送的唤醒词与数据库中的唤醒词匹配成功，也就是说，外界发送的唤醒词与数据库中的唤醒词相同，可以在数据库中找到外界发送的唤醒词，则终端102接受该唤醒词的设定。如果外界发送的唤醒词与数据库中的唤醒词不匹配，也就是说，外界发送的唤醒词与数据库中的唤醒词不同，在数据库中找不到外界发送的唤醒词。则终端102接受该唤醒词的设定失败。

步骤103：将所述唤醒词语音进行特征提取，得到唤醒词特征信息。

其中，唤醒词特征信息是指可以和终端102的数据库中的唤醒词信息进行匹配的特征信息。

具体地，终端102将外界发送过来的唤醒词语音进行特征提取，得到可以和数据库中的唤醒词信息进行匹配的唤醒词特征信息。需要说明的是，外界发送过来的唤醒词语音不能直接地与数据库中的唤醒词信息进行匹配。需要经过终端102处理并提取必要的唤醒词特征信息，通过将提取到的必要的唤醒词特征信息与数据库中的唤醒词信息进行匹配，才能得到确切的匹配结果。

步骤105：将所述唤醒词特征信息与唤醒词数据库进行匹配。若匹配成功，则获取是否继续匹配唤醒词信号。否则，输出唤醒词匹配失败信号并继续获取唤醒词语音。若获取到继续匹配唤醒词信号，则重复获取唤醒词语音。若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音。

其中，唤醒词数据库是一种数据库，该数据库指含有可以和唤醒词特征信息进行匹配的唤醒词数据，命令词语音为终端102的执行其他运作的指示性词汇，是外界命令词语音发送到终端102的关于命令词的语音。

具体地，终端102将外界发送过来的唤醒词语音进行特征提取，得到可以和数据库中的唤醒词数据进行匹配的唤醒词特征信息。再将得到的唤醒词特征信息和唤醒词数据库中的唤醒词数据进行匹配。也就是说，对比唤醒词特征信息与唤醒词数据库中的唤醒词数据是否相同，进一步地，查找唤醒词数据库中是否存在和提取得到的唤醒词特征信息相同的唤醒词数据。如果唤醒词数据库中存在和提取得到的唤醒词特征信息相同的唤醒词数据，那么终端102接收该唤醒词的设定。如果唤醒词数据库中不存在和提取得到的唤醒词特征信息相同的唤醒词数据，那么终端102不接受接收该唤醒词的设定。当终端102接收该唤醒词的设定后，获取外界是否继续匹配唤醒词的命令。若终端102收到外界继续匹配唤醒词的命令则重复步骤101、步骤103和步骤105。若终端102收到外界中止匹配唤醒词的命令则终端102结束接收唤醒词的设定，并开始接收命令词的设定。

步骤107：将所述命令词语音进行特征提取，得到命令词特征信息。

其中，命令词特征信息是指可以和终端102的数据库中的命令词信息进行匹配的特征信息。

具体地，终端102将外界发送过来的命令词语音进行特征提取，得到可以和数据库中的命令词信息进行匹配的命令词特征信息。需要说明的是，外界发送过来的命令词语音不能直接地与数据库中的命令词信息进行匹配。需要经过终端102处理并提取必要的命令词特征信息，通过将提取到的必要的命令词特征信息与数据库中的命令词信息进行匹配，才能得到确切的匹配结果。

步骤109：将所述命令词特征信息与命令词数据库进行匹配。若匹配成功，则获取是否继续匹配命令词信号。否则，输出命令词匹配失败信号并继续获取命令词语音。若获取到继续匹配命令词信号，则重复获取命令词语音。若获取到停止继续匹配命令词信号，则输出命令词设定结束信号。

其中，命令词数据库是一种数据库，该数据库指含有可以和命令词特征信息进行匹配的命令词数据，命令词语音为终端102的执行其他运作的指示性词汇，是外界命令词语音发送到终端102的关于命令词的语音。

具体地，终端102将外界发送过来的命令词语音进行特征提取，得到可以和数据库中的命令词数据进行匹配的命令词特征信息。再将得到的命令词特征信息和命令词数据库中的命令词数据进行匹配。也就是说，对比命令词特征信息与命令词数据库中的命令词数据是否相同，进一步地，查找命令词数据库中是否存在和提取得到的命令词特征信息相同的命令词数据。如果命令词数据库中存在和提取得到的命令词特征信息相同的命令词数据，那么终端102接收该命令词的设定。如果命令词数据库中不存在和提取得到的命令词特征信息相同的命令词数据，那么终端102不接受接收该命令词的设定。当终端102接收该命令词的设定后，获取外界是否继续匹配命令词的命令。若终端102收到外界继续匹配命令词的命令则重复步骤107和步骤109。若终端102收到外界中止匹配命令词的命令则终端102结束接收命令词的设定，并开始接收命令词的设定。

上述语音识别和设定方法中，终端102通过获取多个唤醒词语音来设定多个不同的唤醒词，终端102通过获取多个命令词来设定多个不同的命令词。使得用户需要在同一空间内对多个终端102中的一个进行语音操作时，不会干扰其他终端102工作。

在其中一个实施例中，所述唤醒词特征信息包括唤醒词语种信息，所述唤醒词数据库包括唤醒词语种数据库。步骤105：所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括步骤205和步骤305，其中：

步骤205：将所述唤醒词语种信息与所述唤醒词语种数据库进行匹配，得到匹配结果。

其中，唤醒词语种指的是所述唤醒词语音的语种，例如，中文、英文等。唤醒词语种信息指的是所述唤醒词语音经过处理得到的语种特性信息。此为现有技术，故不再赘述。所述唤醒词语种数据库指的是终端102中存储有多个语种的唤醒词信息的数据库。

具体地，终端102将外界发送过来的唤醒词语音进行语种特征提取，得到语种特性信息，该语种特性信息可以和所述唤醒词语种数据库中语种的唤醒词信息进行匹配。若匹配成功，证明外界发送过来的唤醒词语音的语种是终端102可以接受的语种。如此，唤醒词语种数据库增加了终端102可以接收的语种范围，增加了终端102的适用范围。

在其中一个实施例中，所述唤醒词特征信息还包括唤醒词文字信息，所述唤醒词数据库还包括唤醒词文字数据库，步骤105：所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括：

步骤305：将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配，若所述唤醒词文字信息与所述唤醒词文字数据库匹配成功并且所述唤醒词语种信息与所述唤醒词语种数据库进行匹配成功，则唤醒词特征信息与唤醒词数据库匹配成功，否则唤醒词特征信息与唤醒词数据库匹配失败。

其中，唤醒词文字信息，指的是所述唤醒词语音经过处理得到的文字特性信息。唤醒词文字数据库指的是终端102中存储有多个文字的唤醒词信息的数据库。

具体地，终端102将外界发送过来的唤醒词语音进行文字特征提取，得到可以和所述唤醒词文字数据库中文字的唤醒词信息进行匹配的文字特性信息。若匹配成功，证明外界发送过来的唤醒词语音的文字是终端102可以接受的文字。如此，唤醒词语种数据库增加了终端102可以接收的文字范围，增加了终端102的适用范围。

在其中一个实施例中，所述命令词特征信息包括命令词语种信息，所述命令词数据库包括命令词语种数据库，步骤109：所述将命令词特征信息与命令词数据库进行匹配的步骤包括步骤209和步骤309，其中：

步骤209：将所述命令词语种信息与所述命令词语种数据库进行匹配，得到匹配结果。

其中，命令词语种指的是所述命令词语音的语种，例如，中文、英文等多个语种。命令词语种信息指的是所述命令词语音经过处理得到的语种特性信息。此为现有技术，故不再赘述。所述命令词语种数据库指的是终端102中存储有多个语种的命令词信息的数据库。

具体地，终端102将外界发送过来的命令词语音进行语种特征提取，得到语种特性信息，该语种特性信息可以和所述命令词语种数据库中语种的命令词信息进行匹配。若匹配成功，证明外界发送过来的命令词语音的语种是终端102可以接受的语种。如此，命令词语种数据库增加了终端102可以接收的语种范围，增加了终端102的适用范围。

步骤309：将所述命令词文字信息与所述命令词文字数据库进行匹配，若所述命令词文字信息与所述命令词文字数据库匹配成功并且所述命令词语种信息与所述命令词语种数据库进行匹配成功，则命令词特征信息与命令词数据库匹配成功，否则命令词特征信息与命令词数据库匹配失败。

其中，命令词文字信息，指的是所述命令词语音经过处理得到的文字特性信息。命令词文字数据库指的是终端102中存储有多个文字的命令词信息的数据库。

具体地，终端102将外界发送过来的命令词语音进行文字特征提取，得到可以和所述命令词文字数据库中文字的命令词信息进行匹配的文字特性信息。若匹配成功，证明外界发送过来的命令词语音的文字是终端102可以接受的文字。如此，命令词语种数据库增加了终端102可以接收的文字范围，增加了终端102的适用范围。

在其中一个实施例中，所述唤醒词文字数据库包括唤醒词声学模型、多个预设唤醒文字和预设唤醒词组；步骤305：将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配的步骤包括：步骤405：根据所述唤醒词声学模型将所述唤醒词文字信息拆分为唤醒词音节，根据所述预设唤醒文字将每一所述唤醒词音节转化为唤醒词文字，根据接收到的所述唤醒词文字信息的顺序对所述唤醒词文字进行排序得到对比唤醒词组，将所述对比唤醒词组与所述预设唤醒词组进行匹配。

其中，唤醒词声学模型指的是可以将唤醒词文字信息拆分为唤醒词音节的声学模型，在本实施例中，唤醒词声学模型为隐马尔可夫模型。预设唤醒文字是组成预设唤醒词组的文字单元。预设唤醒词组是与对比唤醒词组进行匹配的唤醒词信息。如此，唤醒词声学模型提高了终端102接收唤醒词设定的精度。

在其中一个实施例中，所述命令词文字数据库包括命令词声学模型、多个预设命令文字和预设命令词组；步骤309：所述将所述命令词文字信息与所述命令词文字数据库进行匹配的步骤包括：步骤409：根据所述命令词声学模型将所述命令词文字信息拆分为命令词音节，根据所述预设命令文字将每一所述命令词音节转化为命令词文字，根据接收到的所述命令词文字信息的顺序对所述命令词文字进行排序得到对比命令词组，将所述对比命令词组与所述预设命令词组进行匹配。

其中，命令词声学模型指的是可以将命令词文字信息拆分为命令词音节的声学模型，在本实施例中，命令词声学模型为隐马尔可夫模型。预设命令文字是组成预设命令词组的文字单元。预设命令词组是与对比命令词组进行匹配的命令词信息。如此，命令词声学模型提高了终端102接收命令词设定的精度。

应该理解的是，虽然图2至图4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2至图4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种语音识别和设定装置，包括：语音接收模块501、指令接收模块503、特征提取模块505、匹配模块507和输出模块509，其中：

语音接收模块501，用于接收唤醒词语音和命令词语音。

指令接收模块503，用于接收是否继续匹配唤醒词信号和是否继续匹配命令词信号。

特征提取模块505，用于从所述唤醒词语音中提取到唤醒词特征信息，具体地，特征提取模块505用于从所述唤醒词语音中提取到唤醒词语种信息和唤醒词文字信息。从所述命令词语音中提取到命令词特征信息，具体地，特征提取模块505用于从所述命令词语音中提取到命令词语种信息和命令词文字信息。

匹配模块507，用于将所述唤醒词特征信息与唤醒词数据库进行匹配，具体地，匹配模块507用于将唤醒词语种信息与唤醒词语种数据库进行匹配。匹配模块507用于将唤醒词文字信息与唤醒词文字数据库进行匹配，进一步地，匹配模块507用于将所述命令词特征信息与命令词数据库进行匹配。具体地，根据所述唤醒词声学模型将所述唤醒词文字信息拆分为唤醒词音节，根据所述预设唤醒文字将每一所述唤醒词音节转化为唤醒词文字，根据接收到的所述唤醒词文字信息的顺序对所述唤醒词文字进行排序得到对比唤醒词组，将所述对比唤醒词组与所述预设唤醒词组进行匹配。匹配模块507用于将命令词语种信息与命令词语种数据库进行匹配。匹配模块507用于将命令词文字信息与命令词文字数据库进行匹配，进一步地，匹配模块507用于根据所述命令词声学模型将所述命令词文字信息拆分为命令词音节，根据所述预设命令文字将每一所述命令词音节转化为命令词文字，根据接收到的所述命令词文字信息的顺序对所述命令词文字进行排序得到对比命令词组，将所述对比命令词组与所述预设命令词组进行匹配。

输出模块509，用于输出唤醒词匹配失败信号、唤醒词匹配结束信号、输出命令词设定结束信号以及命令词匹配失败信号。

关于语音识别和设定装置的具体限定可以参见上文中对于语音识别和设定方法的限定，在此不再赘述。上述语音识别和设定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音识别和设定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

获取唤醒词语音；

将所述唤醒词语音进行特征提取，得到唤醒词特征信息；

将所述唤醒词特征信息与唤醒词数据库进行匹配；

若匹配成功，则获取是否继续匹配唤醒词信号；

否则，输出唤醒词匹配失败信号并继续获取唤醒词语音；

若获取到继续匹配唤醒词信号，则重复获取唤醒词语音；

若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音；

将所述命令词语音进行特征提取，得到命令词特征信息；

将所述命令词特征信息与命令词数据库进行匹配；

若匹配成功，则获取是否继续匹配命令词信号；

否则，输出命令词匹配失败信号并继续获取命令词语音；

若获取到继续匹配命令词信号，则重复获取命令词语音；

若获取到停止继续匹配唤醒词信号，则输出命令词设定结束信号。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述唤醒词特征信息包括唤醒词语种信息，所述唤醒词数据库包括唤醒词语种数据库，所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括：将所述唤醒词语种信息与所述唤醒词语种数据库进行匹配，得到匹配结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述唤醒词特征信息还包括唤醒词文字信息，所述唤醒词数据库还包括唤醒词文字数据库，所述将唤醒词特征信息与唤醒词数据库进行匹配的步骤包括：将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配，若所述唤醒词文字信息与所述唤醒词文字数据库匹配成功并且所述唤醒词语种信息与所述唤醒词语种数据库进行匹配成功，则唤醒词特征信息与唤醒词数据库匹配成功，否则唤醒词特征信息与唤醒词数据库匹配失败。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述命令词特征信息包括命令词语种信息，所述命令词数据库包括命令词语种数据库，所述将命令词特征信息与命令词数据库进行匹配的步骤包括：将所述命令词语种信息与所述命令词语种数据库进行匹配，得到匹配结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述命令词特征信息还包括命令词文字信息，所述命令词数据库还包括命令词文字数据库，所述将命令词特征信息与命令词数据库进行匹配的步骤包括：将所述命令词文字信息与所述命令词文字数据库进行匹配，若所述命令词文字信息与所述命令词文字数据库匹配成功并且所述命令词语种信息与所述命令词语种数据库进行匹配成功，则命令词特征信息与命令词数据库匹配成功，否则命令词特征信息与命令词数据库匹配失败。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述唤醒词文字数据库包括唤醒词声学模型、多个预设唤醒文字和预设唤醒词组；所述将所述唤醒词文字信息与所述唤醒词文字数据库进行匹配的步骤包括：根据所述唤醒词声学模型将所述唤醒词文字信息拆分为唤醒词音节，根据所述预设唤醒文字将每一所述唤醒词音节转化为唤醒词文字，根据接收到的所述唤醒词文字信息的顺序对所述唤醒词文字进行排序得到对比唤醒词组，将所述对比唤醒词组与所述预设唤醒词组进行匹配。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：所述命令词文字数据库包括命令词声学模型、多个预设命令文字和预设命令词组；所述将所述命令词文字信息与所述命令词文字数据库进行匹配的步骤包括：根据所述命令词声学模型将所述命令词文字信息拆分为命令词音节，根据所述预设命令文字将每一所述命令词音节转化为命令词文字，根据接收到的所述命令词文字信息的顺序对所述命令词文字进行排序得到对比命令词组，将所述对比命令词组与所述预设命令词组进行匹配。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取唤醒词语音；

将所述唤醒词语音进行特征提取，得到唤醒词特征信息；

将所述唤醒词特征信息与唤醒词数据库进行匹配；

若匹配成功，则获取是否继续匹配唤醒词信号；

否则，输出唤醒词匹配失败信号并继续获取唤醒词语音；

若获取到继续匹配唤醒词信号，则重复获取唤醒词语音；

若获取到停止继续匹配唤醒词信号，输出唤醒词匹配结束信号，并获取命令词语音；

将所述命令词语音进行特征提取，得到命令词特征信息；

将所述命令词特征信息与命令词数据库进行匹配；

若匹配成功，则获取是否继续匹配命令词信号；

否则，输出命令词匹配失败信号并继续获取命令词语音；

若获取到继续匹配命令词信号，则重复获取命令词语音；

若获取到停止继续匹配唤醒词信号，则输出命令词设定结束信号。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

18页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：解码方法、解码装置、程序以及记录介质

语音识别和设定方法、装置、计算机设备和存储介质

相关技术

网友询问留言