用户问题的处理方法、装置和服务器

文档序号:190575 发布日期:2021-11-02 浏览:30次 >En<

阅读说明:本技术 用户问题的处理方法、装置和服务器 (User problem processing method and device and server ) 是由 常梦圆 贾玉红 王鹏 林孙镇江 于 2021-08-02 设计创作,主要内容包括:本说明书提供了用户问题的处理方法、装置和服务器。基于该方法,服务器在接收到用户的问题文本后,可以先根据预设的概念化知识库和预设的处理规则,通过处理用户的问题文本,得到匹配的目标查询语句;其中,所使用的预设的概念化知识库至少包括:预设的问题查询模板库,预设的问题查询模板库包括有多个问题查询模板;再根据目标查询语句来查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。通过引入并利用预设的概念化知识库,可以适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。(The specification provides a user problem processing method, a user problem processing device and a server. Based on the method, after receiving the problem text of the user, the server can firstly process the problem text of the user according to a preset conceptualized knowledge base and a preset processing rule to obtain a matched target query statement; wherein, the preset conceptualized knowledge base at least comprises: the system comprises a preset problem query template library, a database and a database, wherein the preset problem query template library comprises a plurality of problem query templates; and then, inquiring a preset knowledge graph according to the target inquiry statement to obtain a target answer text corresponding to the question text of the user. By introducing and utilizing the preset conceptualized knowledge base, the method and the device can be suitable for diversified complex scenes, efficiently and accurately determine the target answer text corresponding to the question text of the user, feed the target answer text back to the user in time, and improve the interaction experience of the user.)

用户问题的处理方法、装置和服务器

技术领域

本说明书属于人工智能技术领域,尤其涉及用户问题的处理方法、装置和服务器。

背景技术

网络平台的系统服务器每天都会接收到大量用户提出的等待解答的问题。

基于现有方法,往往需要预先训练一个基于传统语言学的语义解析模型。进而可以利用上述语义解析模型处理用户提出的问题,以最终找出与用户提出的问题对应的答案。

但是,基于上述方法所训练得到的语义解析模型所适用的场景范围通常相对有限,且模型的训练成本、维护成本也相对较高。此外,由于上述语义解析模型的适用范围有限,导致当所面对的场景变得较为复杂、多样时,模型的准确率会表现得相对较差,进而使得最终确定出答案容易出现误差,影响用户的交互体验。

针对上述问题,目前尚未提出有效的解决方案。

发明内容

本说明书提供了一种用户问题的处理方法、装置和服务器,通过引入并利用预设的概念化知识库,以适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。

本说明书实施例提供了一种用户问题的处理方法,包括:

获取用户的问题文本;

根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;

根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

在一些实施例中,所述问题查询模板至少包含有:模板名称、内容数据、条件数据、查询语句;其中,所述内容数据包含有针对问题查询模板中的实体对象和关系的定义参数,所述条件数据包含有针对问题查询模板中的实体对象的条件参数。

在一些实施例中,所述预设的概念化知识库还包括:预设的同义词库、预设的权重库。

在一些实施例中,根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句,包括:

对所述用户的问题文本进行分词处理,得到多个词素;

根据预设的同义词库,从预设的知识图谱中确定出多个词素的链接结果;

根据所述多个词素的链接结果,构建问题文本的结构化模板;

根据问题文本的结构化模板,从预设的问题查询模板库中确定出相匹配的目标问题查询模板;

获取目标问题查询目标中的查询语句,作为与所述用户的问题文本匹配的目标查询语句。

在一些实施例中,根据预设的同义词库,从预设的知识图谱中确定出多个词素的链接结果,包括:

根据预设的同义词库,针对各个词素,从预设的知识图谱中筛选各个词素的多个候选链接结果;

基于预设的权重库,根据预设的评分算法,计算出各个词素的候选链接结果的评分值;

根据评分值,从各个词素的候选链接结果中确定各个词素的链接结果。

在一些实施例中,根据预设的评分算法,计算出各个词素的候选链接结果的评分值,包括:

按照以下方式计算当前词素的当前候选链接结果的评分值:

确定当前候选链接结果的实体类型,以及字符数类型;

查询预设的权重库,确定出与当前候选链接结果的实体类型匹配的权重,作为第一权重;确定出与当前候选链接结果的字符数类型匹配的权重,作为第二权重;

计算当前词素与当前词素的当前候选链接结果的编辑距离;

根据所述第一权重、第二权重和编辑距离,计算当前词素的当前候选链接结果的评分值。

在一些实施例中,根据所述第一权重、第二权重和编辑距离,计算当前词素的当前候选链接结果的评分值,包括:按照以下算式计算当前词素的当前候选链接结果的评分值:

ω=q×p-d

其中,ω为当前词素的当前候选链接结果的评分值,q为第一权重,p为第二权重,d为编辑距离。

在一些实施例中,根据问题文本的结构化模板,从预设的问题查询模板库中确定出相匹配的目标问题查询模板,包括:

确定出问题文本的结构化模板中的词素的实体类型;

根据问题文本的结构化模板中的词素的实体类型,从预设的问题查询模板库中筛选出多个候选问题查询模板;

根据预设的相似度算法,计算问题文本的结构化模板与各个候选问题查询模板的相似度参数;

根据相似度参数,从多个候选问题查询模板中确定出相匹配的目标问题查询模板。

在一些实施例中,在根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本之后,所述方法还包括:

将所述目标答案文本发送至终端设备,并通过所述终端设备向用户展示所述目标答案文本。

本说明书实施例还提供了一种用户问题的处理装置,包括:

获取模块,用于获取用户的问题文本;

处理模块,用于根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;

查询模块,用于根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

本说明书实施例还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现以下步骤:获取用户的问题文本;根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被计算机设备执行时实现:获取用户的问题文本;根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

本说明书提供了一种用户问题的处理方法、装置和服务器。基于该方法,具体实施前,可以先构建好至少包含有预设的问题查询模板库的预设的概念化知识库,以及预设的知识图谱,其中,预设的问题查询模板库包括有多个问题查询模板;每一个问题查询模板至少包含有:模板名称、内容数据、条件数据、查询语句等模板数据;具体实施时,服务器在接收到用户的问题文本后,可以先根据预设的概念化知识库和预设的处理规则,通过处理用户的问题文本,得到匹配的且适用于预设的知识图谱的目标查询语句;再根据目标查询语句来查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。通过引入并利用预设的概念化知识库,可以适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。

附图说明

为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本说明书的一个实施例提供的用户问题的处理方法的流程示意图;

图2是本说明书的一个实施例提供的服务器的结构组成示意图;

图3是本说明书的一个实施例提供的用户问题的处理装置的结构组成示意图;

图4是在一个场景示例中,应用本说明书实施例提供的用户问题的处理方法的一种实施例的示意图;

图5是在一个场景示例中,应用本说明书实施例提供的用户问题的处理方法的一种实施例的示意图;

图6是在一个场景示例中,应用本说明书实施例提供的用户问题的处理方法的一种实施例的示意图;

图7是在一个场景示例中,应用本说明书实施例提供的用户问题的处理方法的一种实施例的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

参阅图1所示,本说明书实施例提供了一种用户问题的处理方法。其中,该方法具体应用于客服系统的服务器一侧。具体实施时,该方法可以包括以下内容:

S101:获取用户的问题文本;

S102:根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;

S103:根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

通过上述实施例,具体实施前,可以预先获取并根据多个应用场景下的历史问答记录,构建得到预设的知识图谱;同时,通过对多个应用场景下的历史问答记录中的问题进行归纳和分类,可以构建得到至少包含有预设的问题查询模板库的预设的概念化知识库;其中,预设的问题查询模板库中可以包含有多个对应不同应用场景下的不同类型问题的问题查询模板,每一个问题查询模板进一步又可以包含有该模板所对应的模板名称、内容数据、条件数据、查询语句等模板数据;具体实施时,当用户提出问题后,可以获取用户的问题文本,并根据预设的概念化知识库和预设的处理规则,通过处理该用户的问题文本,得到与该用户的问题文本匹配的目标查询语句;进而可以根据该目标查询语句,通过查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。从而可以通过引入并利用上述预设的概念化知识库、预设的知识图谱,能够较好地适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。

在一些实施例中,上述方法具体可以应用于客服系统的服务器一侧。其中,所述服务器具体可以包括一种应用于客服中心数据处理系统的,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。

在一些实施例中,用户可以通过所使用的终端设备输入自己期望解答的问题。相应的,终端设备可以获取用户的问题,并将用户的问题以文本数据的形式发送至服务器。从而服务器可以获取得到用户的问题文本。

具体的,用户可以通过终端设备以文本数据的形式输入问题。这时,终端设备可以直接得到用户的问题文本。当然,用户还可以通过终端设备以语音数据的形式输入问题。这时,终端设备直接得到的是语音数据形式的用户的问题;终端设备可以先对该语音数据形式的用户的问题进行语义识别,得到对应的用户的问题文本。

其中,所述终端设备具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端设备。具体的,所述终端设备例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在智能手机上运行的某APP等。

在一些实施例中,具体实施前,可以获取并根据多种不同应用场景下用户的提示提问记录构建预设的知识图谱。

可以先获取大量多种不同应用场景下用户的历史提问记录。其中,上述多种不同应用场景具体可以包括:售前咨询场景、售后咨询场景、合作咨询场景、网点咨询场景等等。再从历史提问记录中抽取出问题和答案,并对问题和答案进行分词处理,得到对应分词结果(也可以称为词素)。结合多种应用场景下的场景需求,确定出各个分词结果的结果类型。其中,结果类型具体可以包括:无意义词、实体对象、关系、属性。进一步,可以根据分词结果的结果类型,过滤掉结果类型为无意义词的分词结果,得到过滤后的分词结果;再对过滤后的分词结果进行语义识别,并合并相同语义的过滤后的分词结果,得到处理后的分词结果。最后,可以根据分词结果的结果类型,利用上述处理后的分词结果,构建预设的知识图谱。

具体的,例如,针对网点咨询场景,上述实体对象具体可以包括:网点、省市、日期等,实体对象的属性具体可以包括:联系电话、地址、机构代码等。关系具体可以包括:网点与日期的营业时间关系、网点与省市的所属关系等。

具体构建预设的知识图谱时,可以根据结果类型为实体对象的分词结果,在预设的知识图谱中设置对应的节点。根据结果类型为关系的分词结果,将预设的知识图谱中对应相应的两个实体对象的两个节点,使用边连接起来。其中,该边用于表征所连接的两个节点所对应的实体对象之间存在的关系。根据结果类型为属性的分词结果,对预设的知识图谱中对应的节点和边分别进行相应的属性信息的标注。从而可以得到能够较为全面地覆盖多种不同应用场景的、符合要求的预设的知识图谱。

在一些实施例中,具体实施前,还可以获取并根据多种不同应用场景下用户的提示提问记录构建预设的概念化知识库。

上述预设的概念化知识库具体可以理解为一种包含有用于确定查询预设的知识图谱的查询语句的预设的结构化数据的数据库。

其中,所述预设的问题查询模板库(可以记为kbqa_pro_mask_template)也称为KBQA(Knowledge-based Question Answering,知识图谱问答系统),具体可以与预设的知识图谱匹配。所述预设的概念化知识库至少包括:预设的问题查询模板库。所述预设的问题查询模板库具体可以包含有多个问题查询模板。所述多个问题查询模板具体可以是预先根据基于大量多种不同应用场景下用户的历史提问记录所抽取出的问题整理得到的。

在一些实施例中,所述问题查询模板至少包含有:模板名称、内容数据、条件数据、查询语句等模板数据;其中,所述内容数据(例如,content)具体可以包含有针对问题查询模板中的实体对象和关系的定义参数,所述条件数据(例如,condition)具体可以包含有针对问题查询模板中的实体对象的条件参数。

具体的,每一个问题查询模板可以包括与该问题查询模板对应的模板名称(name,例如:A网点的营业时间)、所对应的内容数据(content,例如:实体对象的定义参数[entity_1],关系的定义参数[entity_1]的[relation_ontology_1]等)、所对应的条件数据(condition,例如,对该模板中实体对象的身份ID和标签label的条件限定Ent.id==XXX,Ent.label in[xx,yy,zz]),以及与该问题查询模板对应的查询语句(gremlin,例如:gremlin查询指令)等。

通过上述实施例,可以引入并利用上述问题查询模板这种结构化的模板数据,构建得到效果较好、较为全面的预设的问题查询模板库。

在一些实施例中,上述问题查询模板中所包含的查询语句具体可以包括gremlin查询语句等。

在一些实施例中,具体实施前,可以先从大量多种不同应用场景下用户的历史提问记录所抽取大量问题;再对上述大量问题进行聚类,得到多个类型问题组。其中,每一个类型问题组包含有所对应的一个应用场景下的同一类型的一个或多个问题。

针对各个类型问题组,分别确定出类型问题组的中心问题。再对各个类型问题组的中心问题进行分词处理,得到对应的分词结果。根据分词结果,确定与该类型问题组对应的节点类型(例如,[entity_1])、边类型(例如,[relation_ontology_1])、点属性信息[(例如,entity_property_ontology_1])、边属性信息(例如,[relation_property_ontology_1])作为内容数据(例如,content),以及针对节点、边的类型约束作为条件数据(例如,condition),以构建得到与该类型问题组对应的问题查询模板。

通过上述实施例,可以预先构建出能够较为全面地覆盖多种不同应用场景下的不同类型问题的多个问题查询模板。

在一些实施例中,所述预设的概念化知识库进一步还可以包括:预设的同义词库、预设的权重库等。

其中,上述预设的同义词库(可以记为kbqa_ontology_synonym)具体可以保存有指示相同实体对象、相同关系、相同属性、相同类型等的同义词。上述预设的同义词库具体可以是根据大量历史提问记录统计得到的。

上述预设的权重库(可以记为kbqa_prior_probability_weight)具体可以保存有与各种实体类型、字符数类型匹配对应的预设权重。上述预设的权重库中的预设权重具体可以是根据相应的权重规则,并结合大量历史提问记录确定的。

具体的,例如,对于较为精细的实体类型,和/或,字符数较多(例如,字符数大于1)的字符数类型,可以设置数值相对较大的权重。相反,对于较为宽泛的实体类型,和/或,字符数较少(例如,字符数等于1)的字符数类型,可以设置数值相对较小的权重。

通过上述实施例,可以在预设的概念化知识库中进一步引入并使用预设的同义词库、预设的权重库,从而得到效果相对更好的预设的概念化知识库。

在一些实施例中,上述根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句,具体实施时,可以包括以下内容:

S1:对所述用户的问题文本进行分词处理,得到多个词素;

S2:根据预设的同义词库,从预设的知识图谱中确定出多个词素的链接结果;

S3:根据所述多个词素的链接结果,构建问题文本的结构化模板;

S4:根据问题文本的结构化模板,从预设的问题查询模板库中确定出相匹配的目标问题查询模板;

S5:获取目标问题查询目标中的查询语句,作为与所述用户的问题文本匹配的目标查询语句。

通过上述实施例,可以基于上述预设的概念化知识库和预设的处理规则,通过处理用户的问题文本,精准地确定并得到与该用户的问题文本相匹配的目标查询语句。

在一些实施例中,具体实施时,可以调用ES引擎(elasticsearch,一种查询引擎)内置的中文分词工具ik_max_word,对用户的问题文本进行细粒度的分词处理(例如,mention切分),得到多个词素。

在一些示例中,具体实施时,可以通过对实体对象、关系、属性,以及时间、标签、关键词等多个维度,结合预设的同义词库,在预设的知识图谱中针对多个词素进行链接结果召回,可以得到与所述多个词素中的各个词素相同或相匹配的链接结果,得到多个词素的链接结果。

在一些实施例中,上述根据预设的同义词库,从预设的知识图谱中确定出多个词素的链接结果,具体实施时,可以包括以下内容:

S1:根据预设的同义词库,针对各个词素,从预设的知识图谱中筛选各个词素的多个候选链接结果;

S2:基于预设的权重库,根据预设的评分算法,计算出各个词素的候选链接结果的评分值;

S3:根据评分值,从各个词素的候选链接结果中确定各个词素的链接结果。

通过上述实施例,可以先根据预设的知识图谱,初筛出与各个词素相同或相近的多个候选链接结果;再对多个候选链接结果进行进一步的精筛,从而可以较为准确地确定出多个词素的链接结果。

在一些实施例中,上述根据预设的同义词库,针对各个词素,从预设的知识图谱中筛选各个词素的多个候选链接结果,具体实施时,针对一个词素,可以先确定该词素的类型是实体对象还是关系,或者属性;再根据该词素的类型对预设的知识图谱所包含的同类型的数据中进行针对性的检索,找到包含有该词素,或者语义上与该词素相同或相近的数据,作为该词素的候选链接结果。

例如,针对词素“A市”,可以确定出该词素的类型是实体对象;进而可以对预设的知识图谱中所包含的实体对象进行针对性的检索,以找到包含有“A市”这几个字符,或者与“A市”所表征的语义相近的实体对象,例如“B省A市”、“A市C区”、“A市D店”等,作为词素“A市”的多个候选链接结果。

在一些实施例中,上述根据预设的评分算法,计算出各个词素的候选链接结果的评分值,具体实施时,可以包括以下内容:可以按照以下方式计算当前词素的当前候选链接结果的评分值:

S1:确定当前候选链接结果的实体类型,以及字符数类型;

S2:查询预设的权重库,确定出与当前候选链接结果的实体类型匹配的权重,作为第一权重;确定出与当前候选链接结果的字符数类型匹配的权重,作为第二权重;

S3:计算当前词素与当前词素的当前候选链接结果的编辑距离;

S4:根据所述第一权重、第二权重和编辑距离,计算当前词素的当前候选链接结果的评分值。

通过上述实施例,根据预设的评分算法,可以同时综合多种因素,较为准确地针对各个词素的候选链接结果确定出参考价值较高、效果较好的评分值。

具体的,上述字符数类型可以包括第一字符数类型(字符数为1)和第二字符数类型(字符数大于1)。根据预设的权重库,对应第一字符数类型,第二权重的数值可以为0.3;对应第二字符数类型,第二权重的数值可以为1。

在一些实施例中,上述根据所述第一权重、第二权重和编辑距离,计算当前词素的当前候选链接结果的评分值:包括:

ω=q×p-d

其中,ω为当前词素的当前候选链接结果的评分值,q为第一权重,p为第二权重,d为编辑距离。

通过上述实施例,基于上述算式,可以以量化的方式,精细地确定出各个词素的各个候选链接结果的评分值。

在一些实施例中,具体实施时,针对单个词素,可以根据该词素的多个候选链接结果的评分值,筛选出评分值最高的候选链接结果,作为该词素的连接结果。

在一些实施例中,上述根据所述多个词素的链接结果,构建问题文本的结构化模板,具体实施时,可以包括:根据各个词素的链接结果,确定出问题文本中对应的节点类型、边类型、点属性信息、边属性信息,以及针对节点、边的类型约束,以抽象得到问题文本的结构化模板。

在一些实施例中,上述根据问题文本的结构化模板,从预设的问题查询模板库中确定出相匹配的目标问题查询模板,具体实施时,可以包括以下内容:

S1:确定出问题文本的结构化模板中的词素的实体类型;

S2:根据问题文本的结构化模板中的词素的实体类型,从预设的问题查询模板库中筛选出多个候选问题查询模板;

S3:根据预设的相似度算法,计算问题文本的结构化模板与各个候选问题查询模板的相似度参数;

S4:根据相似度参数,从多个候选问题查询模板中确定出相匹配的目标问题查询模板。

通过上述实施例,可以利用预设的概念化知识库,准确地找到与用户的问题文本相匹配的目标问题查询模板,进而可以基于该目标问题查询模板,准确且高效地确定出匹配对应,且适合于查询预设的知识图谱的目标查询语句。

在一些实施例中,具体实施时,可以根据问题文本的结构化模板中的词素的实体类型,对预设的问题查询模板库进行初筛,找出所包含的实体类型(或者节点类型)与问题文本的结构化模板相同或相近的问题查询模板作为候选问题查询模板。

在一些实施例中,上述根据预设的相似度算法,计算问题文本的结构化模板与各个候选问题查询模板的相似度参数,具体实施时,可以包括以下内容:

按照以下算式计算问题文本的结构化模板与当前候选问题查询模板的相似度参数:

其中,S为问题文本的结构化模板与当前候选问题查询模板的相似度参数,ωi为当前候选问题查询模板中编号为i的词素的评分值,i为大于等于1且小于等于m的整数,m为当前候选问题查询模板中词素的总数,ωmax为当前候选问题查询模板中词素的评分值的最大值。

通过上述实施例,可以计算得到较为准确、参考价值较高的相似度参数,进而后续可以基于上述相似度参数,对多个候选问题查询模板进行进一步的细筛,以找到相匹配的目标问题查询模板。

在一些实施例中,在具体计算问题文本的结构化模板与各个候选问题查询模板的相似度参数之前,可以先调用精度较高的预设的分词模型(例如,HANLP模型)对用户的问题文本进行重新的分词处理后,再按照上述算式计算目标相似度参数,从而可以得到精度更高、更加可靠的相似度参数。

在一些实施例中,在根据预设的相似度算法,计算问题文本的结构化模板与各个候选问题查询模板的相似度参数之后,所述方法还可以包括:

S1:确定并根据问题文本的结构化模板与各个候选问题查询模板中相同链接结果数,以及链接结果的排序,得到问题文本的结构化模板与各个候选问题查询模板的第一修正参数,可以记为Smask

S2:确定并根据问题文本的结构化模板与各个候选问题查询模板中除去停用词后,相同链接结果的评分值,以及表征顺序的链接结果个数的评分值,得到问题文本的结构化模板与各个候选问题查询模板的第二修正参数,可以记为Scharacter

S3:根据第一修正参数、第二修正参数,和相似度参数,得到问题文本的结构化模板与各个候选问题查询模板的改进后的相似度参数。

通过上述实施例,可以得到精度相对更高、效果相对更好的改进后的相似度参数;进而可以利用上述改进后的相似度参数代替普通的相似度参数,来更加精准地确定出目标问题查询模板。

在一些实施例中,具体实施时,可以按照以下算式,计算出改进后的相似度参数:

S′=S×Scharacter×Smask

其中,S′为改进后的相似度参数,Scharacter为第二修正参数,Smask为第一修正参数。

在一些实施例中,具体实施时,可以将目标问题查询模板中所包含的查询语句确定为与用户的问题文本相匹配的目标查询语句。进而可以调用上述目标查询语句对预设的知识图谱进行针对性的查询处理,以得到与该用户的问题文本对应的目标答案文本。

在一些实施例中,在根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本之后,所述方法具体实施时,还可以包括以下内容:将所述目标答案文本发送至终端设备,并通过所述终端设备向用户展示所述目标答案文本。

通过上述实施例,服务器可以在利用目标查询语句查询得到所需要的目标答案文本之后,及时地将该目标答案文本反馈给终端设备;进而可以通过终端设备及时地向该用户展示出用户所需要的目标答案文本,从而使得用户能够获得较好的交互体验。

由上可见,基于本说明书实施例提供的用户问题的处理方法,具体实施前,可以先构建好至少包含有预设的问题查询模板库的预设的概念化知识库,以及预设的知识图谱,其中,预设的问题查询模板库包括有多个问题查询模板;每一个问题查询模板至少包含有:模板名称、内容数据、条件数据、查询语句等数据;具体实施时,服务器在接收到用户的问题文本后,可以先根据预设的概念化知识库和预设的处理规则,通过处理用户的问题文本,得到匹配的目标查询语句;再根据目标查询语句来查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。通过引入并利用预设的概念化知识库,可以适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。

本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取用户的问题文本;根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

为了能够更加准确地完成上述指令,参阅图2所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口201、处理器202以及存储器203,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。

其中,所述网络通信端口201,具体可以用于获取用户的问题文本。

所述处理器202,具体可以用于根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

所述存储器203,具体可以用于存储相应的指令程序。

在本实施例中,所述网络通信端口201可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。

在本实施例中,所述处理器202可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

在本实施例中,所述存储器203可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。

本说明书实施例还提供了一种基于上述用户问题的处理方法的计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现以下内容:获取用户的问题文本;根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。

在本实施例中,该计算机可读存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。

参阅图3所示,在软件层面上,本说明书实施例还提供了一种用户问题的处理装置,该装置具体可以包括以下的结构模块:

获取模块301,具体可以用于获取用户的问题文本;

处理模块302,具体可以用于根据预设的概念化知识库和预设的处理规则,处理所述用户的问题文本,得到与所述用户的问题文本匹配的目标查询语句;其中,所述预设的概念化知识库至少包括:预设的问题查询模板库,所述预设的问题查询模板库包含有多个问题查询模板;

查询模块303,具体可以用于根据所述目标查询语句,查询预设的知识图谱,得到与用户的问题文本对应的目标答案文本。

需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

由上可见,本说明书实施例提供的用户问题的处理装置,通过引入并利用预设的概念化知识库,可以适用于多样化的复杂场景,高效、准确地确定出与用户的问题文本对应的目标答案文本,并及时地反馈给用户,提高用户的交互体验。

在一个具体的场景示例中,可以应用本说明书实施例所提供的用户问题的处理方法来构建基于知识图谱的金融领域KBQA系统,进而可以利用该系统自动答复用户的问题。具体实施过程可以参阅以下内容。

步骤一:根据场景与问答需求,构建相关知识图谱(预设的知识图谱)。例如,问答需求为网点咨询相关的客服问题,则该图谱中的实体具体可以包括:网点、省市、日期等,并将联系电话、地址、机构代码等信息作为实体的属性。此外。图谱中的关系具体可以包括:网点与日期的营业时间关系、网点与省市的所属关系等。具体可以参阅图4所示。

步骤二:构建概念化知识库(例如,预设的概念化知识库)。

其中,概念化知识库要由以下3部分组成:

(1)kbqa_pro_mask_template:KBQA概念化模板库(例如,预设的问题查询模板库),配置有问题查询模板。

在本场景示例中,上述KBQA概念化模板库是一种扩展与改进后的模板库,增加了条件、命令参数等。基于该模板库可以快速方便适应复杂场景的需求,同时降低模板的配置数量,提高问答效率。

具体的,概念化模板库由一下几个参数构成:name(例如,模板名称):表征问题模板的名称,eg:A网点的营业时间;content(例如,内容数据):新增的模板的内容,eg:[entity_1]的[relation_ontology_1];condition(例如,条件数据):新增模板的模板条件,eg:Ent.id==XXX,Ent.label in[xx,yy,zz];gremlin(例如,查询语句):新增模板对应的gremlin查询命令。

(2)kbqa_ontology_synonym:KBQA本体同义词库(例如,预设的同义词库),配置了本体级别的同义词。

(3)kbqa_prior_probability_weight:KBQA先验权重库(例如,预设的权重库),配置了实体链接时对应不同类型实体的链接权重值。

步骤三:知识推理。推理引擎接收到问题后,首先通过内置的词表的辅助进行mention切分(分词),再通过ES进行图谱内容的召回,生成候选项,将候选项进行排序打分(基于全局优化编辑距离),保留得分最高的一组候选项。对链接后的结果在模板库中进行召回,找到最佳匹配项。知识推理的流程可以参阅图5所示。具体实施时,可以包括以下内容。

(1)ES mention切分,利用ES内置的中文分词工具ik_max_word进行最细粒度的分词。

(2)链接模块,该模块内部可划分为:实体、属性值链接:其中实体、属性是指图谱中的数据,采用ES索引方法进行召回和识别。体链接:本体是指图谱schema,包括实体、关系、属性的label。通过本体同义词表的映射进行连接。日期、时间链接:日期链接和时间链接实际为同一模块但精度不同,采用正则匹配进行识别。日期和时间点经过此模块,统一转换为标准格式XX年XX月XX日XX时。其中,日期与时间模块的工作流程可以参阅图6所示。以及关键词链接:配置的keyword,加载模板时存入内存中。

在利用上述链接规则召回图谱内容后,利用基于编辑距离的算法对召回结果进行初筛,同时遵循字符串匹配最大化原则。

具体基于初筛的结果,利用HANLP模型对问题中的mention和召回结果分别进行分词,计算精确地匹配相似度,保留得分最高的一组候选项,计算公式如下:

ω=q×p-d

其中,在字符数大于阈值(例如1)时,p取值为0.3;在字符数等于阈值时,p取值为1。q为一个与实体类型对应的权重,d为编辑距离。

(3)意图匹配模块,对链接后的结果进行mask(例如,构建对应的结构化模板),根据模板和query mask中的元素类型做筛选,召回部分模板。对模板进行粗略的剪枝,再进行模板的精确匹配,在链接结果中根据元素类型和condition约束找到最优路径,即与其最为匹配的模板。排序后得到一组得分最高的候选模板。该组模板则为意图的最佳匹配,然后执行对应的查询语句,得到query的答案。Eg:A网点的营业时间,经过对链接模块后,问题将会被翻译为如下两种情况。可以参阅图7所示。

参阅图7,如果共召回了2个模板(例如,候选问题查询模板),接下来可以对这两个模板进行排序,得分高的模板即为最匹配的意图项。得分规则计算如下:

S′=S×Scharacter×Smask

其中,Smask为模板中匹配个数和匹配顺序的得分(对应第一修正参数);Scharacter为去掉停用词后,词相同个数得分、顺序词个数的得分(对应第二修正参数);S为mask和其他字符作为完整句子计算相似度得分(对应目标相似度参数)。

进一步,S按照以下算式计算:

其中,∑ωi为mention元素(分词后的链接结果)的链接得分总和;m为mention个数;ωmax为mention元素的链接得分的最大值。

(4)查询模块,经过意图匹配模块得到最为匹配的模板后,通过前期配置的概念化知识模板,可得到对应的gremlin查询语句(例如,目标查询语句)。gremlin语句进行图谱查询,返回问题的答案。从而可以利用上述系统查询得到对应问题的答案。

通过上述场景示例,验证了本说明书实施例提供的用户问题的处理方法可以较好地适应复杂场景下的问答需求,获得更高的问答准确率,同时优化了概念化模板配置规则,极大简化了模板配置的数量,减少了人工配置模板的工作量,提升了查询引擎的效率,使用户获得更好地使用感受。

虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端设备产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机可读存储介质中。

通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

20页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于语义规则的心理知识与方法推荐系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!