信息处理方法、装置及电子设备

文档序号:1087408 发布日期:2020-10-20 浏览:7次 >En<

阅读说明:本技术 信息处理方法、装置及电子设备 (Information processing method and device and electronic equipment ) 是由 韩伟 于 2019-04-04 设计创作,主要内容包括:本发明实施例提供一种信息处理方法、装置及电子设备,该方法包括:获取待识别的文本信息,依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息;由此可见,本实施例中在进行语义识别之前,无需对语音信息或者文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对各语言单元实时进行语义识别处理,提高了语义识别的实时性。(The embodiment of the invention provides an information processing method, an information processing device and electronic equipment, wherein the method comprises the following steps: acquiring text information to be recognized, sequentially determining a set number of vocabularies of the text information as language units, performing semantic recognition processing on the language units, and determining effective semantic information of the text information according to a semantic recognition result of the language units; therefore, in the embodiment, before semantic recognition, no pre-segmentation is needed to be performed on the voice information or the text information, so that semantic recognition errors caused by segmentation errors are avoided, and the accuracy of semantic recognition is improved; in addition, because the semantic recognition processing is carried out on each language unit in real time, the real-time performance of the semantic recognition is improved.)

信息处理方法、装置及电子设备

技术领域

本发明实施例涉及人工智能技术领域,尤其涉及一种信息处理方法、装置及电子设备。

背景技术

随着人机交互技术的发展,语义识别技术显示出其重要性。语义识别是从人类发出的语音信号中提取特征信息并确定其语言含义的过程,主要包括语音识别过程和语义理解过程。语音识别过程是利用声学模型将人类的语音信号转换为文本的过程,语义理解过程是利用自然语言模型对文本的含义进行识别的过程。

现有技术中,在对用户输入的语音信号进行处理时,首先利用语音活动性检测(voice activity detection,VAD)技术,在连续的语音信号中确定出各个语音片段的起始点和终止点,实现对连续语音信号的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。

然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。

发明内容

本发明实施例提供一种信息处理方法、装置及电子设备,用以提高语义识别的准确率。

第一方面,本发明实施例提供一种信息处理方法,包括:

获取待识别的文本信息;

依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。

可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息,包括:

若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。

可选的,所述若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,包括:

针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;

对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;

若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。

可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。

可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。

可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所述第一语言单元之间间隔预设数量的语言单元。

可选的,所述方法还包括:若所述第二语言单元的语义完整性概率得分满足设定条件,将所述历史语言单元从缓存中删除。

可选的,所述方法还包括:

若所述第二语言单元的语义完整性概率得分不满足设定条件,则将所述第二语言单元确定为所述历史语言单元,并缓存至缓存中。

可选的,所述将所述第二语言单元的语义信息作为所述文本信息的有效语义信息之后,还包括:

获取已缓存的预测语义信息和所述预测语义信息对应的预测回复信息,所述预测语义信息是根据所述历史语言单元的语义信息进行预测得到的;

若所述有效语义信息和所述预测语义信息一致,则将所述预测回复信息作为所述文本信息对应的回复信息。

可选的,所述获取待识别的文本信息之前,还包括:

获取输入智能设备的语音信息,并对所述语音信息进行语音识别处理,得到待识别的文本信息。

可选的,确定所述文本信息的有效语义信息之后,还包括:

根据所述有效语义信息,获取所述文本信息对应的回复信息;

控制智能设备输出所述回复信息。

第二方面,本发明实施例提供一种信息处理装置,包括:

获取模块,用于获取待识别的文本信息;

第一识别模块,用于依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。

可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述第一识别模块具体用于:

若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。

可选的,所述第一识别模块具体用于:

针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;

对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;

若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。

可选的,所述第一识别模块具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。

可选的,所述第一识别模块具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。

可选的,所述第一识别模块具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所述第一语言单元之间间隔预设数量的语言单元。

可选的,所述第一识别模块还用于:

若所述第二语言单元的语义完整性概率得分满足设定条件,将所述历史语言单元从缓存中删除。

可选的,所述第一识别模块还用于:

若所述第二语言单元的语义完整性概率得分不满足设定条件,则将所述第二语言单元确定为所述历史语言单元,并缓存至缓存中。

可选的,所述第一识别模块还用于:

获取已缓存的预测语义信息和所述预测语义信息对应的预测回复信息,所述预测语义信息是根据所述历史语言单元的语义信息进行预测得到的;

若所述有效语义信息和所述预测语义信息一致,则将所述预测回复信息作为所述文本信息对应的回复信息。

可选的,所述装置还包括:第二识别模块;

所述获取模块,还用于获取输入智能设备的语音信息;

所述第二识别模块,用于对所述语音信息进行语音识别处理,得到待识别的文本信息。

可选的,所述第一识别模块还用于:

根据所述有效语义信息,获取所述文本信息对应的回复信息;

控制智能设备输出所述回复信息。

第三方面,本发明实施例提供一种电子设备,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的方法。

第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的方法。

第五方面,本发明实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如上第一方面任一项所述的方法。

第六方面,本发明实施例提供一种芯片,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得安装有所述芯片的电子设备执行如上第一方面任一项所述的方法。

本发明实施例提供的技术方案,获取待识别的文本信息,依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息;由此可见,本实施例中在进行语义识别之前,无需对语音信息或者文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对各语言单元实时进行语义识别处理,提高了语义识别的实时性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为现有技术中语义识别过程的示意图;

图2为本发明实施例提供的信息处理方法的流程示意图一;

图3为本发明实施例提供的信息处理方法的流程示意图二;

图4为本发明实施例提供的语义识别过程的示意图一;

图5为本发明实施例提供的语义识别过程的示意图二;

图6为本发明实施例提供的信息处理方法的流程示意图三;

图7为本发明实施例提供的信息处理装置的结构示意图一;

图8为本发明实施例提供的信息处理装置的结构示意图二;

图9为本发明实施例提供的电子设备的硬件结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1为现有技术中语义识别过程的示意图,如图1所示,在对用户输入的语音信息进行处理时,首先利用语音活动性检测(voice activity detection,VAD)技术,在连续的语音信息中确定出各个语音片段的起始点和终止点,实现对连续语音信息的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。具体的,将语音片段输入自动语音识别(Automatic Speech Recognition,ASR)模型进行识别,得到语音片段对应的文本信息,然后将文本信息输入至自然语言处理(Natural Language Processing,NLP)模型中进行识别,得到文本信息对应的语义信息。

然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。

为了解决上述问题,本发明实施例提供一种信息处理方法。本实施例中,对连续的语音信息不进行切分而进行语音识别,得到待识别的文本信息,并依次将该文本信息的设定数量的词汇作为语言单元实时进行语义识别处理,并根据各语言单元的语义识别结果,确定文本信息的有效语义信息;由于无需对语音信息或者文本信息进行预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对语音识别得到的语言单元实时进行语义识别处理,提高了语义识别的实时性。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本发明实施例提供的信息处理方法的流程示意图一,本实施例的方法可以由服务器执行,还可以由智能设备的控制器执行。其中,,智能设备可以是具有与用户进行人机对话功能的任意电子设备,包括但不限于:机器人、智能音箱、智能家居、智能穿戴设备、智能手机等。

需要说明的是,为了描述方便,本实施例以及后续实施例中,在涉及举例说明时仅以智能设备为例进行描述。

如图2所示,该信息处理方法,可以包括:

S201:获取待识别的文本信息。

其中,待识别的文本信息可以为长文本信息。也就是说,待识别的文本信息是没有经过切分的文本信息。

所述文本信息可以是用户输入智能设备中的。一种可能的场景中,用户直接向智能设备中输入文本信息。另一种可能的场景中,用户向智能设备中输入语音信息,然后智能设备通过对语音信息进行语音识别,得到文本信息。

基于上述的第二种场景,S201可以具体包括:

获取输入智能设备的语音信息,并对所述语音信息进行语音识别处理,得到待识别的文本信息。

具体的,获取输入智能设备的语音信息时,可以通过智能设备的麦克风采集用户的语音信息,也可以通过网络或者蓝牙等方式接收其他设备获取的用户的语音信息。需要说明的是,本发明实施例只是以这两种可能的实现方式获取用户的语音信息为例进行说明,但并不代表本发明实施例仅局限于此。

获取到语音信息后,可以采用语音识别技术,实时对语音信息进行语音识别处理,得到文本信息。一种可选的实施方式中,将所述语音信息输入至自动语音识别ASR模型中,ASR模型输出识别得到的文本信息。

本实施例与现有技术不同的是,在智能设备获取到用户输入的语音信息后,并不对语音信息进行切分,而是直接对语音信息进行语音识别得到文本信息。示例性的,识别得到的文本信息可能为“你看这个机器人挺好的咱们试一下吧今天天气怎么样效果真不错吧”。

S202:依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。

本实施例中,将依次从文本信息中读取的设定数量的词汇称为语言单元。可以理解的,每次进行语义识别处理的词汇的数量可以进行配置。例如,可以将该设定数量配置为1;又如,可以将该设定数量配置为3。一般地,所配置的设定数量的数值越小,语义识别准确度越高。但所配置的设定数量的数值越小,所耗费的处理时长也会越长。

本发明实施例中,对语音信息进行语音识别过程中,对于识别到的文本信息,依次读取该文本信息中设定数量的词汇,实时进行语义识别处理。

一种可选的实施方式中,利用自然语言处理NLP模型,依次将该文本信息中设定数量的词汇输入至NLP模型进行语义识别处理。具体的,采用ASR模型对语音信息进行语音识别时,将识别得到的文本信息以设定数量的词汇为语言单元依次实时输入至NLP模型中,由NLP模型对设定数量的词汇进行语义识别处理。由于输入NLP模型的各词汇是流水式的实时输入的,能够提高语义识别的实时性。

NLP模型通常一次可以处理一定长度的文本片段。作为一种可能的实现方式,NLP模型对输入的文本片段进行分词处理,得到关键词序列,然后根据关键词序列获取具有上下文语义关系的词向量,然后将词向量输入分类模型中进行特征提取,分类模型根据提取的特征输出该文本片段所属的语义类别的概率。

可选的,NLP模型中的分类模型可以为深度神经网络模型。

示例性的,假设语音信息为“今天天气怎么样”,对该语音信息进行语音识别时,依次识别得到的词汇分别为:

“今”、“天”、“天”、“气”、“怎”、“么”、“样”

以设定数量配置成1为例,上述各词汇会实时的依次输入至NLP模型中进行语义识别处理。具体的,NLP模型会依次对“今”、“今天”、“今天天”、“今天天气”、“今天天气怎”、“今天天气怎么”、“今天天气怎么样”进行语义识别处理,并根据得到的语义识别结果,确定文本信息的有效语义信息。

一种可能的实施方式中,在对文本信息的各语言单元进行语义识别过程中,若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。

本实施例中,依次对文本信息中的设定数量的词汇为语言单元进行语义识别时,若其中的连续N个语言单元对应的完整性概率得分满足预设条件,则将该N个语言单元的语义信息作为文本信息的有效语义信息。可以理解的,“连续N个语言单元对应的语义完整性概率得分满足预设条件”是指连续N个语言单元对应的语义较为完整。

可以理解的,在根据语言单元的语义完整性概率得分确定语义是否完整时,可以采用多种预设条件进行判定。本发明实施例对此不作具体限定。

示例性的,假设文本信息中的词汇分别为:“今、天、气、怎、么、样、唱、首、歌、吧”,以每个词汇作为一个语言单元进行语义识别,第1至6个语言单元“今、天、气、怎、么、样”的语义较为完整,第7至10个语言单元“唱、首、歌、吧”的语义较为完整,因此,将上述两组语言单元对应的语义信息作为文本信息的有效语义信息。

本实施例提供的信息处理方法中,获取待识别的文本信息,依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息;由此可见,本实施例中在进行语义识别之前,无需对语音信息或者文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对各语言单元实时进行语义识别处理,提高了语义识别的实时性。

图3为本发明实施例提供的信息处理方法的流程示意图二。本实施例对图2所示的实施例进行细化。如图3所示,本实施例的方法,包括:

S301:获取输入智能设备的语音信息,并对所述语音信息进行语音识别处理,得到待识别的文本信息。

本实施例中,S301的具体实施方式与图2所示实施例类似,此处不再赘述。

S302:依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,得到语义识别结果,所述语义识别结果包括:语义完整性概率得分和语义信息。

本实施例中,语义识别结果包括:语义完整性概率得分和语义信息。具体的,在利用NLP模型进行语义识别处理时,将语言单元输入NLP模型中,NLP模型对该语言单元进行语义识别处理,输出该语言单元的语义信息,同时还会输出该语言单元的语义完整性概率得分。

可以理解的,语义完整性概率得分用于指示语言单元所表达的语义的完整性。可以理解的,语言单元所表达的语义越完整,则对应的语义完整性概率得分越高;语言单元所表达的语义越不完整,则对应的语义完整性概率得分越低。例如:“今天天气”的语义完整性概率得分要小于“今天天气怎么样”的语义完整性概率得分。

S303:针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件。

可以理解的,已缓存的历史语言单元的词汇顺序与原始的语音信息中的词汇顺序是一致的。

另外,本实施例对于历史语言单元的缓存位置不做具体限定。可以理解的,历史语言单元可以是缓存在NLP模型的缓存中,还可以是缓存在NLP模型外部的缓存中。

S304:对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果。

可以理解的,拼接得到的第二语言单元中的词汇顺序与原始的语音信息中的词汇顺序是一致的。

S305:若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息,并将所述历史语言单元从缓存中删除;若所述第二语言单元的语义完整性概率得分不满足设定条件,则将所述第二语言单元确定为所述历史语言单元,并缓存至缓存中。

其中,语言单元对应的语义完整性概率得分不满足设定条件是指:语言单元对应的语义完整性概率得分较低,即该语言单元表达的语义不完整。语言单元对应的语义完整性概率得分满足设定条件是指:语言单元对应的语义完整性概率得分较高,即语言单元表达的语义完整。

本实施例中的设定条件可以有多种形式,对此不作具体限定。一种可能的实施方式中,将语义完整性概率得分大于或等于预设阈值作为设定条件。即,当语言单元的语义完整性概率得分大于或等于预设阈值时,认为该语言单元的语义是完整的,当语言单元的语义完整性概率得分小于预设阈值时,认为该语言单元的语义是不完整的。

下面结合举例进行说明。通过ASR模型进行语音识别得到长文本信息,从该长文本信息的起始位置开始,取设定数量的词汇(记为语言单元1)输入至NLP模型进行语义识别,由于这是第1个待识别的语言单元,缓存中没有历史语言单元,因此将语言单元1输入NLP模型中得到语言单元1的语义完整性概率得分和语义信息。下面分两种情况进行说明。

情况1:若语言单元1的语义完整性概率得分大于或等于预设阈值,说明语言单元1的语义是完整的,因此,将语言单元1的语义信息作为文本信息的有效语义信息。然后继续从该长文本信息当前的起始位置开始,取设定数量的词汇(记为语言单元2)进行语义识别,识别过程与语言单元1类似。

情况2:若语言单元1的语义完整性概率得分小于预设阈值,说明语言单元1的语义不完整,因此,将语言单元1缓存到缓存中。该情况下,继续从该长文本信息当前的起始位置开始,取设定数量的词汇(即语言单元2),并从缓存中获取历史语言单元(即,语言单元1),将语言单元1和语言单元2进行拼接得到新的语言单元。

然后对新的语言单元进行语义识别处理,得到新的语言单元的语义完整性概率得分和语义信息。对新的语言单元进行语义识别处理时,又分为以下两种情况进行说明。

情况3:若新的语言单元的语义完整性概率得分大于或等于预设阈值,则将新的语言单元的语义信息作为所述文本信息的有效语义信息。该情况下,由于新的语言单元的语义信息中已包含语言单元1的语义信息,因此,将语言单元1从缓存中删除。然后继续从该长文本信息当前的起始位置开始,取设定数量的词汇(记为语言单元3)进行语义识别,识别过程与语言单元1类似。

情况4:若新的语言单元的语义完整性概率得分小于预设阈值,则将语言单元2也存储至缓存中,作为历史语言单元,此时历史语言单元包括语言单元1和语言单元2。该情况下,继续从该长文本信息当前的起始位置开始,取设定数量的词汇(即语言单元3),并从缓存中获取历史语言单元(即,语言单元1和语言单元2),将语言单元1、语言单元2和语言单元3进行拼接得到新的语言单元。然后对新的语言单元进行语义识别处理,具体处理过程与上述过程类似,此处不再赘述。

S306:根据所述有效语义信息,获取所述文本信息对应的回复信息,控制智能设备输出所述回复信息。

具体的,根据有效语义信息,获取文本信息对应的回复信息可以有多种实施方式。一种可选的实施方式中,可以根据有效语义信息,查询知识库获取回复信息。其中,知识库中记录了不同语义信息对应的回复信息。

另外,智能设备输出的回复信息,可以是文本形式,也可以是音频、视频、图片等多媒体信息形式,还可以是语音形式,即TTS(英文全称:Text To Speech,中文全称:从文本到语音)。可以理解的,本实施例中智能设备在输出回复信息时,可以是上述中的任一种形式,还可以是上述中至少两种形式的结合,本实施例对此不作具体限定。

需要说明的是,本实施例中对文本信息进行回复时,对文本信息中的语句句式不作具体限定。示例性的,可以为陈述语句,也可以为疑问语句,还可以是感叹语句等。也就是说,本实施例不仅对疑问句式的文本信息进行回复,对其他句式的文本信息也可以回复。

本实施例中在对语音信息进行语义识别之前,无需对语音信息进行任何预切分,并且,在对语音信息进行语音识别得到文本信息后,也无需对文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,本实施例中,将语音识别得到的文本信息中设定数量的词汇作为语言单元实时进行语义识别处理,提高了语义识别的实时性;当连续N个语言单元的语义完整性概率得分满足预设条件时,将连续N个语言单元的语义信息作为文本信息的有效语义信息,提高了语义识别的准确性。

下面以图4为例描述本实施例的语义识别处理过程。图4为本发明实施例提供的语义识别过程的示意图一,如图4所示,假设对语音信息进行语音识别得到的文本信息中的词汇分别为:

“今”、“天”、“天”、“气”、“怎”、“么”、“样”

将每个词汇作为一个语言单元实时依次输入至NLP模型中。当将第1个语言单元“今”输入至NLP模型后,NLP模型计算并输出语言单元“今”对应的语义信息(未示出)和语义完整性概率得分。如图4所示,语言单元“今”的语义完整性概率得分为0.01,由于该语义完整性概率得分低于预设阈值(假设预设阈值为0.95),可以将第1个语言单元“今”先进行缓存。

针对待识别的第2个语言单元“天”,先从缓存中取出历史语言单元“今”,将历史语言单元与第2个语言单元进行拼接,得到语言单元“今天”,将语言单元“今天”输入NLP模型中后,NLP模型输出的语义完整性概率得分为0.1;由于该语义完整性概率得分依然低于预设阈值,因此将第2个语言单元“天”也缓存起来。

针对待识别的第3个语言单元“天”,先从缓存中取出历史语言单元“今”、“天”,将历史语言单元与第3个语言单元进行拼接,得到语言单元“今天天”,将语言单元“今天天”输入NLP模型中后,NLP模型输出的语义完整性概率得分为0.2;由于该语义完整性概率得分依然较低,因此,将第3个语言单元“天”也缓存起来。

以此类推,如图4所示,得到“今天天气”对应的语义完整性概率得分为0.75,“今天天气怎”对应的语义完整性概率得分为0.8,“今天天气怎么”对应的语义完整性概率得分为0.9,“今天天气怎么样”对应的语义完整性概率得分为0.95。

可以理解的,具体应用中,可以设置合适的预设阈值,当语义完整性概率得分小于该预设阈值时,将当前的语言单元进行缓存,作为后续语言单元的上下文信息。当语义完整性概率得分大于该预设阈值时,说明语义已经完整,则无需再缓存当前的语言单元。进一步的,可以将当前识别到的语义信息作为文本信息的有效语义信息。

上述举例中是以每个文字作为语言单元为例进行描述的,该方式下,由于需要对每个文字均做一次语义识别过程,计算量较大。一种可选的实施方式中,为了节省计算资源,可以将多个文字作为一个语言单元,例如,将两个字、三个字作为一个语言单元。

需要说明的是,本实施例以及后续实施例中,各语言单元的语义完整性概率得分以及预设阈值的设定仅为示例,本发明并不以此为限。

上述图3和图4所示的实施例中,在依次以设定数量的词汇作为语言单元进行语义识别处理时,只要连续N个语言单元的语义完整性概率得分大于或等于预设阈值,则认为该连续N个语言单元的语义完整,将连续N个语言单元对应的语义信息作为文本信息的有效语义信息。在实际应用中,为了提高语义识别的准确率,在检测到N个语言单元的语义完整性概率得分大于或等于预设阈值时,还可以继续检测后续的一个或者多个语言单元,判断后续语言单元对于语义完整性的贡献情况。下面结合两种可选的实施方式为例进行详细描述。

一种可能的实施方式中,可以根据以下步骤确定第二语言单元的语义完整性概率得分满足设定条件:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。

本实施例中,当检测到第二语言单元的语义完整性概率得分大于等于预设阈值时,继续检测第二语言单元和第三语言单元拼接得到的语言单元的语义完整性概率得分,若语义完整性概率得分有所下降,则说明第二语言单元的语义已完整,第三语言单元表达的是一个新的语义。因此,将第二语言单元的语义信息作为文本信息的有效语义信息。

示例性的,图5为本发明实施例提供的语义识别过程的示意图二。如图5所示,假设依次输入NLP模型的词汇分别为:“天”、“气”、“怎”、“么”、“样”、“效”、“果”、“不”、“错”、“吧”,即设定数量为1。

假设预设阈值为0.8。结合图5,“天”对应的语义完整性概率得分为0.1,“天气”对应的语义完整性概率得分为0.3,“天气怎”对应的语义完整性概率得分为0.7,“天气怎么”对应的语义完整性概率得分为0.75,“天气怎么样”对应的语义完整性概率得分为0.95。

本实施方式中,在前5个词汇的语义完整性概率得分已大于预设阈值的情况下,再多监测一个词汇。拼接第6个词汇得到“天气怎么样效”,该文本的语义完整性概率得分为0.81。也就是说,在前5个词汇的基础上,拼接第6个词汇,会导致语义完整性概率得分有所下降,因此,将前5个词汇作为语义完整的文本片段,将前5个词汇对应的语义信息作为文本信息的有效语义信息。

另一种可选的实施方式中,可以根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件。

其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所述第一语言单元之间间隔预设数量的语言单元。

本实施方式中,第四语言单元与第一语言单元之间间隔的语言单元的数量不作限定,可以间隔两个、三个或者更多个语言单元。具体实施过程中,还可以根据预设的时间阈值确定间隔的语言单元的数量。例如:每次检测到第二语言单元的语义完整性概率得分大于等于预设阈值时,继续检测预设时长内的N个语言单元,若该预设时长内,语义完整性概率得分均没有得到提升,则将第二语言单元的语义信息作为文本信息的有效语义信息。

示例性的,结合图5,假设依次输入NLP模型的各语言单元分别为:“天”、“气”、“怎”、“么”、“样”、“效”、“果”、“不”、“错”、“吧”,即设定数量为1。前5个词汇“天气怎么样”对应的语义完整性概率得分分别为0.95,大于预设阈值0.8。

假设N为3,即需要继续检测后续的3个词汇“效”、“果”、“不”。结合图5,在前5个词汇的基础上,拼接第6个词汇之后得到“天气怎么样效”对应的语义完整性概率得分为0.81,拼接增加第7个词汇之后得到“天气怎么样效果”对应的语义完整性概率得分为0.8,继续拼接第8个词汇之后得到“天气怎么样效果不”对应的语义完整性概率得分为0.7。由此可见,在前5个词汇的基础上,继续拼接后续的3个词汇均无法使得语义完整性概率得分得到提升。因此,将前5个词汇作为语义完整的文本片段,将前5个词汇对应的语义信息作为文本信息的有效语义信息。将“效”之后的词汇作为下一个语句重新进行识别。

与上述实施方式相比,本实施方式在确定目标语言单元之后,继续监测多个语言单元,减少了误判的情况,提高了语义识别的准确性。

在上述图3所示的实施例中,在文本信息的有效语义信息之后,步骤S306中,根据有效语义信息获取回复信息,并控制智能设备输出该回复信息。也就是说,图3所示的实施例中是在识别得到一个相对完整的语义后再获取回复信息。实际应用中,有时仅需要对较少的词汇进行识别,即可预测得到完整的语义信息。例如:假设用户输入的语音信息为“北京天气怎么样”,实际识别过程中,在识别得到前4个词汇“北京天气”对应的语义信息之后,就可以预测到用户的语义是询问北京的天气情况。因此,本发明实施例还提供一种能够根据预测得到的语义信息提前获取回复信息的方案。下面结合图6进行介绍。

图6为本发明实施例提供的信息处理方法的流程示意图三。本实施例是对图3所示实施例中S306的进一步细化。如图6所示,S306可以具体包括:

S3061:获取已缓存的预测语义信息和所述预测语义信息对应的预测回复信息,所述预测语义信息是根据所述历史语言单元的语义信息进行预测得到的。

S3062:若所述有效语义信息和所述预测语义信息一致,则将所述预测回复信息作为所述文本信息对应的回复信息。

具体的,本实施例中,在对每个语言单元进行语义识别时,在该语言单元的语义完整性概率得分不满足设定条件,即该语言单元的语义不完整的情况下,一方面,将该语言单元作为历史语言单元进行缓存;另一方面,根据该语言单元的语义信息,进行完整语义信息的预测,得到预测语义信息。进一步的,根据预测语义信息,获取该预测语义信息对应的预测回复信息。然后将预测语义信息和预测回复信息进行缓存。

需要说明的是,根据语言单元的不完整的语义信息,预测得到完整的语义信息,可以有多种预测方式,本实施例对此不作具体限定,可以采用现有的语义预测方法。

一种可能的实施方式中,针对每个语言单元,得到语义识别结果后,只要该语言单元的语义不完整,则根据该不完整的语义信息进行预测,得到一个完整的预测语义信息。

另一种可能的实施方式中,针对每个语言单元,在该语言单元的语义不完整的情况下,进一步判断该语言单元的语义完整性概率得分是否大于或等于预测阈值,在大于或等于预测阈值时,再进行语义预测,从而可以节省计算资源。可以理解的,该预测阈值小于上述的预设阈值。

示例性的,假设用户输入的语音信息为“北京天气怎么样”,预测阈值为0.5。将每个词汇作为语言单元依次输入NLP模型进行识别的过程中,对第1个词汇“北”进行识别得到的语义完整性概率得分为0.01,对前2个词汇“北京”进行识别得到的语义完整性概率得分为0.1,对前3个词汇“北京天”进行识别得到的语义完整性概率得分为0.2;上述识别过程中,由于各语言单元对应的语义完整性概率得分均小于预测阈值0.5,说明语义很不完整,即使进行语义预测,得到的预测语义信息准确率也较低。因此,对上述3个词汇的识别之后,无需进行语义预测过程。

对前4个词汇“北京天气”进行识别得到的语义完整性概率得分为0.6。前4个词汇对应的语义完整性概率得分大于预测阈值,说明前4个词汇的语义已相对完整,根据“北京天气”已经能够预测到用户的语义是想查询北京天气。因此,本实施例中,在对前4个词汇进行识别后,根据前4个词汇的语义信息进行预测,得到语义完整的预测语义信息。并提前获取北京天气信息作为预测回复信息,将预测语义信息和预测回复信息进行缓存。

进一步的,在对文本信息“北京天气怎么样”进行识别得到有效语义信息后,由于之前已经缓存了一个或者多个预测语义信息和预测回复信息,因此,可以从各预测语义信息中,将与所述有效语义信息一致的预测语义信息对应的预测回复信息,作为所述有效语义信息对应的回复信息,并控制所述智能设备输出所述回复信息。

本实施例中,在根据部分语言单元识别得到并不完整的语义信息时,根据不完整的语义信息进行完整语义的预测,并提前获取预测回复信息进行缓存,当后续识别到完整的语义信息时,只需从缓存中获取相应的回复信息即可,从而提高了语义识别的实时性。

图7为本发明实施例提供的信息处理装置的结构示意图一。本实施例的信息处理装置可以为软件和/或硬件形式,该装置可以具体设置与服务器中,或者设置于智能设备中。

如图7所示,本实施例的信息处理装置700,包括:获取模块701和第一识别模块702。

其中,获取模块701,用于获取待识别的文本信息;

第一识别模块702,用于依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。

本实施例的装置,可用于执行如图2所示的方法实施例,其实现原理和技术效果类似,此处不再赘述。

图8为本发明实施例提供的信息处理装置的结构示意图二。在图7所示实施例的基础上,本实施例的信息处理装置700,还可以包括第二识别模块703。

可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述第一识别模块702具体用于:

若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。

可选的,所述第一识别模块702具体用于:

针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;

对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;

若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。

可选的,所述第一识别模块702具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。

可选的,所述第一识别模块702具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第三语言单元为所述第一语言单元之后且与所述第一语言单元相邻的语言单元。

可选的,所述第一识别模块702具体用于:

若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元与第四语言单元之前的各语言单元拼接得到的语言单元的语义完整性概率得分均小于或等于所述第二语言单元的完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;

其中,所述第四语言单元位于所述第一语言单元之后,且所述第四语言单元与所述第一语言单元之间间隔预设数量的语言单元。

可选的,所述第一识别模块702还用于:

若所述第二语言单元的语义完整性概率得分满足设定条件,将所述历史语言单元从缓存中删除。

可选的,所述第一识别模块702还用于:

若所述第二语言单元的语义完整性概率得分不满足设定条件,则将所述第二语言单元确定为所述历史语言单元,并缓存至缓存中。

可选的,所述第一识别模块702还用于:

获取已缓存的预测语义信息和所述预测语义信息对应的预测回复信息,所述预测语义信息是根据所述历史语言单元的语义信息进行预测得到的;

若所述有效语义信息和所述预测语义信息一致,则将所述预测回复信息作为所述文本信息对应的回复信息。

可选的,所述获取模块701,还用于获取输入智能设备的语音信息;

所述第二识别模块703,用于对所述语音信息进行语音识别处理,得到待识别的文本信息。

可选的,所述第一识别模块702还用于:

根据所述有效语义信息,获取所述文本信息对应的回复信息;

控制智能设备输出所述回复信息。

本发明实施例提供的信息处理装置,可用于执行上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

图9为本发明实施例提供的电子设备的硬件结构示意图,该电子设备可以是智能设备的控制器,还可以是服务器,本发明实施例对此不作具体限定。如图9所示,本实施例的电子设备900,包括:至少一个处理器901和存储器902。其中,处理器901、存储器902通过总线903连接。

在具体实现过程中,至少一个处理器901执行所述存储器902存储的计算机执行指令,使得至少一个处理器901执行上述任一方法实施例的技术方案。

处理器901的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

在上述的图9所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。

总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述任一方法实施例中的技术方案。

上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。

本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行如上任一方法实施例中的技术方案。

本发明实施例还提供一种芯片,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得安装有所述芯片的电子设备执行如上任一方法实施例的技术方案。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

24页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:信息处理方法、装置及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!