一种融合句法分析和语义角色剪枝的意图理解方法

文档序号:1964135 发布日期:2021-12-14 浏览:16次 >En<

阅读说明:本技术 一种融合句法分析和语义角色剪枝的意图理解方法 (Intention understanding method fusing syntactic analysis and semantic role pruning ) 是由 张丹 董晓飞 张学强 曹峰 于 2021-10-12 设计创作,主要内容包括:本发明涉及自然语言处理中的语义分析技术领域,且公开了一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,根据句子成分剪枝和语义角色剪枝得到的文本与原输入文本联合编码建模,句子成分剪枝保留句子的主语、谓语、宾语等主要句子成分,语义角色剪枝保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,剪枝的作用是剔除非句子主要成分或核心论元的其他部分,凸显句子的主要语义。本发明其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。(The invention relates to the technical field of semantic analysis in natural language processing, and discloses an intention understanding method integrating syntactic analysis and semantic role pruning, which comprises a preprocessing module, a semantic matching module and a pruning module, wherein the intention understanding method comprises the steps of jointly coding and modeling a text obtained by sentence component pruning and semantic role pruning and an original input text, the sentence component pruning reserves main sentence components such as a subject, a predicate and an object of a sentence, the semantic role pruning reserves core arguments in the sentence including events, subjects, ranges, action starts, action ends and other verb-related argument roles, and the pruning has the function of eliminating other parts which are not sentence main components or core arguments and highlighting main semantics of the sentence. The invention has the advantages that the semantics are strengthened aiming at the input sentences with too long sentences, too many description words or multiple intentions of the user; the main words expressing sentence semantics through dependency syntax analysis and semantic role labeling enhance semantic information in a form of joint input coding.)

一种融合句法分析和语义角色剪枝的意图理解方法

技术领域

本发明涉及自然语言处理中的语义分析技术领域,具体为一种融合句法分析和语义角色剪枝的意图理解方法。

背景技术

意图理解是指基于用户输入文本从语义的角度准确理解用户的意图,目前,意图理解的常用方法是通过语义相似度模型将用户输入与知识库中的标准问匹配,进而确定用户语义,但当出现用户输入存在句子过长、描述词过多或用户存在多意图的情况下,直接用语义相似度模型将用户输入文本与知识库标准问匹配,很难在知识库中找到相应的标准问,导致难以确定用户的意图,依存句法分析和语义角色标注是自然语言处理中的关键底层技术,依存句法分析的基本任务是识别句子中词汇之间的依存关系,确定句子的句法结构,语义角色标注主要研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们之间的关系,通过依存句法分析对用户输入文本进行句法结构分析,确定句子的主体结构,通过语义角色标注得到句子中的论元,确定句子中的施事、受事等论元角色,通过句法关系进行剪枝,去除句子中冗余的描述词、判断是否存在多个意图,将结果输入到语义相似度模型中,增强语义信息,进而提高意图理解的准确率。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种融合句法分析和语义角色剪枝的意图理解方法,具备针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义与通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息的优点,解决了针对句子过长、描述词过多或用户存在多意图时难以处理的问题。

(二)技术方案

为实现上述目的,本发明提供如下技术方案:一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,所述剪枝模块包含剪枝算法,句子成分剪枝包含以下步骤:

步骤1:确定中心词;

步骤2:确定主语;

步骤3:确定宾语;

语义角色剪枝包含以下步骤:

步骤1:确定句子谓词,进行标记;

步骤2:确定核心论元,保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,并进行标记;

步骤3:对其他与谓词不直接相关的论元,如时间、地点、目的、程度等进行剪枝。

优选的,融合句法分析和语义角色剪枝的意图理解系统主要包括预处理模块、剪枝模块、语义匹配模块、结果输出模块。

优选的,所述确定中心词以获取依存句法树的根节点,作为初始中心词、判断是否有依存于中心词且为连动关系的词,如果存在,加入到中心词列表中。

优选的,所述确定主语以从初始中心词出发,获取依存于初始中心词、依存关系为主谓关系的词,作为主语词。

优选的,所述从初始中心词出发,获取依存于初始中心词、依存关系为动宾关系的词,作为宾语词,判断是否有依存于宾语词且依存关系为并列关系的词,如果存在,加入到宾语词列表中。

优选的,所述语义匹配模块将剪枝后得到的句子成分、语义角色与原始句子共同输入到语义匹配模型。

与现有技术相比,本发明提供了一种融合句法分析和语义角色剪枝的意图理解方法,具备以下有益效果:

1、该融合句法分析和语义角色剪枝的意图理解方法,该融合句法分析和语义角色剪枝的意图理解方法在使用时,用户输入信息文本,信息文本经过预处理中进行处理输出,输入的语句中分词会进行词性标注、依存语法分析、语义角色标注三个环节的处理,依存句法分析出句子成分,语义角色标注处理后得到语义角色,其中句子成分与语义角色为剪枝部分,经过剪枝算法处理后的语句会再通过语义匹配,最终输出用户的意图。

2、该融合句法分析和语义角色剪枝的意图理解方法,本发明对用户输入文本进行依存句法分析和语义角色标注,根据句法结构和语义角色对输入句子进行剪枝,分别得到表达句子语义的句子成分和语义角色,与原始句子共同输入到语义相似度模型进行意图匹配,通过句子成分和语义角色增强句子的语义信息,以提高意图理解的准确率,其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。

附图说明

图1为本发明融合句法分析和语义角色剪枝的意图理解系统框架方法

示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,一种融合句法分析和语义角色剪枝的意图理解方法,包括预处理模块、语义匹配模块与剪枝模块,所述剪枝模块包含剪枝算法,句子成分剪枝包含以下步骤:

步骤1:确定中心词,获取依存句法树的根节点,作为初始中心词,判断是否有依存于中心词且为连动关系的词,如果存在,加入到中心词列表中;

步骤2:确定主语,从初始中心词出发,获取依存于初始中心词、依存关系为主谓关系的词,作为主语词,判断是否有依存于主语词且依存关系为并列关系的词,如果存在,加入到主语词列表中;

步骤3:确定宾语,从初始中心词出发,获取依存于初始中心词、依存关系为动宾关系的词,作为宾语词,判断是否有依存于宾语词且依存关系为并列关系的词,如果存在,加入到宾语词列表中;

语义角色剪枝包含以下步骤:

步骤1:确定句子谓词,进行标记;

步骤2:确定核心论元,保留句中的核心论元,包括施事、受事、范围、动作开始、动作结束及其他动词相关的论元角色,并进行标记;

步骤3:对其他与谓词不直接相关的论元,如时间、地点、目的、程度等进行剪枝。

语义匹配:将剪枝后得到的句子成分、语义角色与原始句子共同输入到语义匹配模型

结果输出:根据语义匹配结果匹配到的标准问意图得到用户意图。

工作原理:该融合句法分析和语义角色剪枝的意图理解方法在使用时,用户输入信息文本,信息文本经过预处理中进行处理输出,输入的语句中分词会进行词性标注、依存语法分析、语义角色标注三个环节的处理,依存句法分析出句子成分,语义角色标注处理后得到语义角色,其中句子成分与语义角色为剪枝部分,经过剪枝算法处理后的语句会再通过语义匹配,最终输出用户的意图,本发明对用户输入文本进行依存句法分析和语义角色标注,根据句法结构和语义角色对输入句子进行剪枝,分别得到表达句子语义的句子成分和语义角色,与原始句子共同输入到语义相似度模型进行意图匹配,通过句子成分和语义角色增强句子的语义信息,以提高意图理解的准确率,其优点在于针对句子过长、描述词过多或用户存在多意图的输入句子进行强化语义;通过依存句法分析和语义角色标注标记表现句子语义的主要词语以联合输入编码的形式增强语义信息。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种写作方法、装置及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!