对话文本生成方法、装置、计算机设备和存储介质

文档序号:1087375 发布日期:2020-10-20 浏览:3次 >En<

阅读说明:本技术 对话文本生成方法、装置、计算机设备和存储介质 (Dialog text generation method and device, computer equipment and storage medium ) 是由 柳明辉 徐国强 于 2020-06-24 设计创作,主要内容包括:本申请涉人工智能技术领域,提供对话文本生成方法、装置、计算机设备和存储介质,包括:接收客户在客户终端输入的问题信息,并转换成第一结构化信息;匹配进行答复的第二结构化信息;将问题信息编码为第一多维向量;将第二结构化信息转换成序列矩阵,将序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将向量编码为第二多维向量;将第一多维向量中对应在各结构层的值,替换为第二多维向量中对应在各结构层的值,得到第三多维向量;最后对第三多维向量进行解码得到输出文本,并将输出文本反馈至所述客户终端。本申请灵活根据客户的话语进行文本的生成,灵活性高,严谨度高。本申请方案还可应用于智慧教育领域,以推进智慧城市建设。(The application relates to the technical field of artificial intelligence, and provides a dialog text generation method, a dialog text generation device, a computer device and a storage medium, wherein the dialog text generation method comprises the following steps: receiving problem information input by a client at a client terminal, and converting the problem information into first structured information; matching the second structured information for replying; encoding the problem information into a first multi-dimensional vector; converting the second structured information into a sequence matrix, and converting the sequence matrix into vectors through front-back linkage; and encoding the vector into a second multi-dimensional vector based on the self-attention mechanism model; replacing the values corresponding to the structural layers in the first multi-dimensional vector with the values corresponding to the structural layers in the second multi-dimensional vector to obtain a third multi-dimensional vector; and finally, decoding the third multi-dimensional vector to obtain an output text, and feeding back the output text to the client terminal. The method and the device flexibly generate the text according to the words of the client, and are high in flexibility and high in rigor. This application scheme still can be applied to wisdom education field to promote wisdom city construction.)

对话文本生成方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能的技术领域,特别涉及一种对话文本生成方法、装置、计算机设备和存储介质。

背景技术

越来越多的企业在微信公众号、APP、网站等多个渠道都接入了大量的客服机器人,智能客服机器人可以7x24小时不间断的为用户提供服务,应用智能客服机器人为客户服务,极大地缩短了用户的等待时间,并且大幅提升客户服务的效率。

然而,目前客服机器人对话存在以下几个缺陷。

目前客服机器人的回复绝大多为根据预先设置的固定话术和对话模板进行回复,灵活性比较差,无法根据客户的话语做到实时生成;现有的实时对话生成模型无法编码结构化的信息,生成的对话比较随意,不够严谨。

发明内容

本申请的主要目的为提供一种对话文本生成方法、装置、计算机设备和存储介质,旨在克服目前客服机器人生成对话时不够严谨以及灵活性差的缺陷。

为实现上述目的,本申请提供了一种对话文本生成方法,包括以下步骤:

接收客户在客户终端输入的问题信息,基于自然语言理解模型对所述问题信息进行识别,并基于识别结果将所述问题信息转换成第一结构化信息;

基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;

将所述问题信息编码为第一多维向量;

将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;

将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;

对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。

进一步地,所述基于识别结果将所述问题信息转换成第一结构化信息的步骤,包括:

根据所述问题信息的语义,对所述问题信息进行分词处理,得到多个词组;

从数据库中调用多个预设的匹配表达式,每个所述匹配表达式均包括匹配词语与目标词语的替换关系;

判断每个所述词组是否与所述匹配表达式中的目标词语相同;

若不同,则获取所述词组与各个所述匹配表达式中匹配词语的相似度,并判断所述相似度是否大于阈值;

若大于,则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式,作为所述词组的目标表达式;

将所述词组匹配为所述目标表达式中目标词语;

根据所述目标词语,构建所述第一结构化信息。

进一步地,所述基于自然语言理解模型对所述问题信息进行识别的步骤之前,包括:

检测所述问题信息中是否出现错误汉字;

若出现,则获取所述问题信息中错误汉字的拼音序列;

查找词典集,在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集;其中,所述词典集中包括拼音与中文词的对应关系;

依次将所述错误汉字替换为所述候选文本集中的文本,并将替换之后得到的问题信息输入至双向长短记忆模型中,验证所述问题信息是否正确;

若正确,则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。

进一步地,所述基于自然语言理解模型对所述问题信息进行识别的步骤之前,包括:

构建所述问题信息的词嵌入;

将所述词嵌入输入至文本识别模型中,以提取所述问题信息对应的第一特征向量;

计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离;其中,所述数据库中预设的每个第二特征向量分别关联有对应的文本;

从所述第二特征向量中,确定出与所述第一特征距离最小的目标特征向量,并获取与所述目标特征向量关联的文本,作为所述问题信息的替换文本。

进一步地,所述接收客户在客户终端输入的问题信息的步骤,包括:

采集客户在客户终端输入的语音信息,并对所述语音信息进行文字识别,得到对应的客户文本;

将所述客户文本输入至双向长短记忆模型中,验证所述客户文本是否正确;

若正确,则将所述客户文本作为所述问题信息。

本申请还提供了一种对话文本生成装置,包括:

接收单元,用于接收客户在客户终端输入的问题信息,基于自然语言理解模型对所述问题信息进行识别,并基于识别结果将所述问题信息转换成第一结构化信息;

匹配单元,用于基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;

编码单元,用于将所述问题信息编码为第一多维向量;

转换单元,用于将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;

替换单元,用于将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;

输出单元,用于对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。

进一步地,所述接收单元基于识别结果将所述问题信息转换成第一结构化信息,具体包括:

根据所述问题信息的语义,对所述问题信息进行分词处理,得到多个词组;

从数据库中调用多个预设的匹配表达式,每个所述匹配表达式均包括匹配词语与目标词语的替换关系;

判断每个所述词组是否与所述匹配表达式中的目标词语相同;

若不同,则获取所述词组与各个所述匹配表达式中匹配词语的相似度,并判断所述相似度是否大于阈值;

若大于,则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式,作为所述词组的目标表达式;

将所述词组匹配为所述目标表达式中目标词语;

根据所述目标词语,构建所述第一结构化信息。

进一步地,所述接收单元,还用于:

检测所述问题信息中是否出现错误汉字;

若出现,则获取所述问题信息中错误汉字的拼音序列;

查找词典集,在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集;其中,所述词典集中包括拼音与中文词的对应关系;

依次将所述错误汉字替换为所述候选文本集中的文本,并将替换之后得到的问题信息输入至双向长短记忆模型中,验证所述问题信息是否正确;

若正确,则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。

进一步地,所述接收单元,还用于:

构建所述问题信息的词嵌入;

将所述词嵌入输入至文本识别模型中,以提取所述问题信息对应的第一特征向量;

计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离;其中,所述数据库中预设的每个第二特征向量分别关联有对应的文本;

从所述第二特征向量中,确定出与所述第一特征距离最小的目标特征向量,并获取与所述目标特征向量关联的文本,作为所述问题信息的替换文本。

进一步地,所述接收单元接收客户在客户终端输入的问题信息,具体包括:

采集客户在客户终端输入的语音信息,并对所述语音信息进行文字识别,得到对应的客户文本;

将所述客户文本输入至双向长短记忆模型中,验证所述客户文本是否正确;

若正确,则将所述客户文本作为所述问题信息。

本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请提供的对话文本生成方法、装置、计算机设备和存储介质,包括:接收客户在客户终端输入的问题信息,并将所述问题信息转换成第一结构化信息;基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;将所述问题信息编码为第一多维向量;将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;上述第三多维向量中保留了客户的用语习惯特征,仅仅是更改了对应要回答的具体内容特征,最后对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。本申请灵活根据客户的话语进行文本的生成,灵活性高,严谨度高。

附图说明

图1是本申请一实施例中对话文本生成方法步骤示意图;

图2是本申请一实施例中对话文本生成装置结构框图;

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

参照图1,本申请一实施例中提供了一种对话文本生成方法,包括以下步骤:

步骤S1,接收客户在客户终端输入的问题信息,基于自然语言理解模型对所述问题信息进行识别,并基于识别结果将所述问题信息转换成第一结构化信息;

步骤S2,基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;

步骤S3,将所述问题信息编码为第一多维向量;

步骤S4,将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;

步骤S5,将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;

步骤S6,对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。

在本实施例中,上述方法应用于客服系统中客服机器人自动针对客户输入的问题进行答复的场景中。本申请中的方案还可以应用于智慧教育领域中问答互动场景中,用于推动智慧城市的建设。

如上述步骤S1所述的,客户可以在客户端输入对应的问题信息,客服机器人系统则可以接收到客户输入的问题信息,该问题信息通常为文本信息,其它实施例中,该问题信息也可以是语音信息。

上述自然语言理解模型(NLP,Natural Language Processing)采用的是自然语言同计算机进行通讯的技术,其可识别出自然语言中的语义,基于识别结果则可以将上述问题信息转换成第一结构化信息,上述第一结构化信息包括多个结构层。具体地,其包括Domain、Act、Slot三个结构层。在一具体实施例中,如贷款服务系统中,上述Domain包括贷款和理财,Act包括通知、请求、推荐,Slot包括额度、期限、利率、收益率。当客户输入的问题信息是“我想贷10W”,则通过自然语言理解模型识别之后得到的第一结构化信息为“Domain:贷款;Act:通知;Slot:贷款额度=10W”。

如上述步骤S2所述的,基于所述第一结构化信息,匹配进行答复的第二结构化信息;该第二结构化信息用于针对上述第一结构化信息进行答复,答复时按照对应的答复规则,第二结构化信息的结构与第一结构化信息相同;具体地,其也包括Domain、Act、Slot三个结构层。例如,上述第二结构化信息为“Domain:贷款;Act:请求;Slot:贷款期限=?”。

如上述步骤S3-S5所述的,通过Bert编码将上述问题信息编码为第一多维向量,具体地,该第一多维向量为128维向量。将上述第二结构化信息中每一个结构层的信息转换成对应的向量,从而将所述第二结构化信息转换成序列矩阵。具体地,上述第二结构化信息可以转换为矩阵B=[[1,0],[0,1,0],[0,1,0,0]]。其中,第一个向量[1,0]表示domain=贷款,[0,1]表示domain=理财;第二个向量[1,0,0]表示通知,[0,1,0]表示请求,[0,0,1]表示推荐;第三个向量[1,0,0,0]表示额度,[0,1,0,0]表示期限,[0,0,1,0]表示利率,[0,0,0,1]表示收益率。将上述矩阵B前后进行链接则可以转换为一个向量,并通过于自注意力机制模型(self-attention),将所述向量编码为第二多维向量,该第二多维向量同样为128维向量。上述第一多维向量与上述第二多维向量的维度一种,便于将上述第一多维向量与上述第二多维向量在维度进行对齐。为了使得客服机器人做出的回复文本更加贴近于人,显得语言表达更加自然,只需要将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;由于该第三多维向量基于第一多维向量的向量结构关系,仅仅是将其中结构层中对应的值替换为第二多维向量对应的值,而第一多维向量由客户的问题信息编码得到,即第一多维向量可以保留客户的用语习惯特性,从而也使得该第三多维向量中保留了客户的用语习惯特征,仅仅是更改了对应要回答的具体内容特征。

最后,如上述步骤S6所述的,对所述第三多维向量进行解码之后得到的输出文本,更接近于人类语言,在对客户进行文本答复时更加严谨,灵活性也更高。

在一实施例中,上述步骤S1中,所述基于识别结果将所述问题信息转换成第一结构化信息的步骤,包括:

S11,根据所述问题信息的语义,对所述问题信息进行分词处理,得到多个词组;

S12,从数据库中调用多个预设的匹配表达式,每个所述匹配表达式均包括匹配词语与目标词语的替换关系;

S13,判断每个所述词组是否与所述匹配表达式中的目标词语相同;

S14,若不同,则获取所述词组与各个所述匹配表达式中匹配词语的相似度,并判断所述相似度是否大于阈值;

S15,若大于,则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式,作为所述词组的目标表达式;

S16,将所述词组匹配为所述目标表达式中目标词语;

S17,根据所述目标词语,构建所述第一结构化信息。

具体地,上述各个匹配表达式具体可以表达为:借钱-贷款、借用-贷款、买东西-购买等。即其表达的是各个匹配词语与目标词语的对应关系。由于客户所输入的文本信息中的词语不一定和最终要转换成的结构化信息中的词语一致,因此,需要对用户输入的词语进行相应的转换处理。具体地,基于自然语言理解模型识别问题信息中的语义,根据所述问题信息的语义,对所述问题信息进行分词处理,得到多个词组;然后将每个词语与所述匹配表达式中的目标词语进行对比,判断是否有相同的目标词语;若没有,则对比所述词组与各个所述匹配表达式中匹配词语的相似度,若相似度大于阈值,则表明其语义相近,表达的意思相近,可以进行替换;若相似度低于阈值,则语义不相近,无法进行替换。若出现至少一个,则需要从多个相近的匹配词语中选择出一个相似度最大的匹配词语,从而确定出对应的匹配表达式,作为所述词语的目标表达式;最后将所述词组替换为所述目标表达式中目标词语,根据目标词语,便可以构建所述第一结构化信息。

例如,在一实施例中,客户输入,我申请借用10W,将借用与上述匹配表达式进行匹配,确定出的目标表达式为:借用-贷款,申请-请求;因此,将借用匹配为贷款,申请匹配为请求,得到的结构化信息即为:“Domain:贷款;Act:请求;Slot:贷款额度=10W”。

在一实施例中,上述步骤S1中,所述基于自然语言理解模型对所述问题信息进行识别的步骤之前,包括:

a、检测所述问题信息中是否出现错误汉字;

b、若出现,则获取所述问题信息中错误汉字的拼音序列;

c、查找词典集,在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集;其中,所述词典集中包括拼音与中文词的对应关系;

d、依次将所述错误汉字替换为所述候选文本集中的文本,并将替换之后得到的问题信息输入至双向长短记忆模型中,验证所述问题信息是否正确;

e、若正确,则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。

在本实施例中,由于客户在输入文字时,经常容易因为同音字而输入错误的文字,例如将“我想贷10W”误输入为“我想带10W”,因此需要对上述客户输入的问题信息进行验证。

在一实施例中,可以通过双向长短记忆模型对(LSTM模型)检测上述问题信息,双向长短记忆模型具有根据前后词进行预测的能力,其可以判断出一个句子中的词的出现是否合理,以此来判断该句子中是否含有错别字;若有错别字,则需要对该词进行同音字转换;转换之后得到的文本不一定正确,因此需要再次输入至双向长短记忆模型进行验证。

在一实施例中,上述步骤S1中,所述基于自然语言理解模型对所述问题信息进行识别的步骤之前,包括:

S101,构建所述问题信息的词嵌入;

S102,将所述词嵌入输入至文本识别模型中,以提取所述问题信息对应的第一特征向量;

S103,计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离;其中,所述数据库中预设的每个第二特征向量分别关联有对应的文本;

S104,从所述第二特征向量中,确定出与所述第一特征距离最小的目标特征向量,并获取与所述目标特征向量关联的文本,作为所述问题信息的替换文本。

在本实施例中,上述客户输入的问题信息可能存在一些错误,若将其输入至自然语言理解模型中可能无法正确识别,因此,需要对其进行处理。本实施例中,预先在数据库中存储有多个文本,以及每个文本对应的第二特征向量;将上述问题信息的词嵌入输入至文本识别模型中,提取出对应的第一特征向量,再计算第一特征向量与第二特征向量之间的距离,该距离用于表达两个向量之间的远近,若相距较远,则表明其对应的文本之间相似度较低;因此,找出一个距离最小的目标特征向量,进而找出一个相似度最高的文本。

在一实施例中,上述步骤S1中,所述接收客户在客户终端输入的问题信息的步骤,包括:

采集客户在客户终端输入的语音信息,并对所述语音信息进行文字识别,得到对应的客户文本;

将所述客户文本输入至双向长短记忆模型中,验证所述客户文本是否正确;

若正确,则将所述客户文本作为所述问题信息。

在本实施例中,客户在上述客户端可以采用语音输入的方式进行提问,在接收到客户在客户终端输入的语音信息,并对所述语音信息进行文字识别,得到对应的客户文本时,由于上述客户文本可能存在转换错误,将其输入至自然语言理解模型中可能无法正确识别,因此需要对其进行验证。在本实施例,采用双向长短记忆模型验证所述客户文本是否正确,若正确,则将所述客户文本作为所述问题信息,若不正确,则采用上述双向长短记忆模型对上述客户文本进行预测,得到多个相近的文本;并将多个文本反馈至客户,请求客户作出对上述文本的选择;最后根据客户的选择确定出对应的问题信息。

参照图2,本申请一实施例中还提供了一种对话文本生成装置,包括:

接收单元10,用于接收客户在客户终端输入的问题信息,基于自然语言理解模型对所述问题信息进行识别,并基于识别结果将所述问题信息转换成第一结构化信息;

匹配单元20,用于基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;

编码单元30,用于将所述问题信息编码为第一多维向量;

转换单元40,用于将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;

替换单元50,用于将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;

输出单元60,用于对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。

在一实施例中,所述接收单元10基于识别结果将所述问题信息转换成第一结构化信息,具体包括:

根据所述问题信息的语义,对所述问题信息进行分词处理,得到多个词组;

从数据库中调用多个预设的匹配表达式,每个所述匹配表达式均包括匹配词语与目标词语的替换关系;

判断每个所述词组是否与所述匹配表达式中的目标词语相同;

若不同,则获取所述词组与各个所述匹配表达式中匹配词语的相似度,并判断所述相似度是否大于阈值;

若大于,则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式,作为所述词组的目标表达式;

将所述词组匹配为所述目标表达式中目标词语;

根据所述目标词语,构建所述第一结构化信息。

在一实施例中,所述接收单元10,还用于:

检测所述问题信息中是否出现错误汉字;

若出现,则获取所述问题信息中错误汉字的拼音序列;

查找词典集,在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集;其中,所述词典集中包括拼音与中文词的对应关系;

依次将所述错误汉字替换为所述候选文本集中的文本,并将替换之后得到的问题信息输入至双向长短记忆模型中,验证所述问题信息是否正确;

若正确,则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。

在一实施例中,所述接收单元10,还用于:

构建所述问题信息的词嵌入;

将所述词嵌入输入至文本识别模型中,以提取所述问题信息对应的第一特征向量;

计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离;其中,所述数据库中预设的每个第二特征向量分别关联有对应的文本;

从所述第二特征向量中,确定出与所述第一特征距离最小的目标特征向量,并获取与所述目标特征向量关联的文本,作为所述问题信息的替换文本。

在一实施例中,所述接收单元10接收客户在客户终端输入的问题信息,具体包括:

采集客户在客户终端输入的语音信息,并对所述语音信息进行文字识别,得到对应的客户文本;

将所述客户文本输入至双向长短记忆模型中,验证所述客户文本是否正确;

若正确,则将所述客户文本作为所述问题信息。

在本实施例中,上述装置实施例中的各个单元的具体实现,请参照上述方法实施例中所述,在此不再进行赘述。

参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对话文本生成方法。

本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种对话文本生成方法。可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。

综上所述,为本申请实施例中提供的对话文本生成方法、装置、计算机设备和存储介质,包括:接收客户在客户终端输入的问题信息,并将所述问题信息转换成第一结构化信息;基于所述第一结构化信息,匹配进行答复的第二结构化信息;所述第一结构化信息与所述第二结构化信息具有相同的结构层;将所述问题信息编码为第一多维向量;将所述第二结构化信息转换成序列矩阵,将所述序列矩阵进行前后链接转换成向量;并基于自注意力机制模型,将所述向量编码为第二多维向量;其中,所述第二多维向量与所述第一多维向量维度相同;将所述第一多维向量中对应在各结构层的值,替换为所述第二多维向量中对应在各结构层的值,得到第三多维向量;上述第三多维向量中保留了客户的用语习惯特征,仅仅是更改了对应要回答的具体内容特征,最后对所述第三多维向量进行解码得到输出文本,并将所述输出文本反馈至所述客户终端。本申请灵活根据客户的话语进行文本的生成,灵活性高,严谨度高。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种会议记录抽取与PPT插入方法与系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!