需求追踪关系构建方法、装置及计算机可读存储介质

文档序号:1904152 发布日期:2021-11-30 浏览:29次 >En<

阅读说明:本技术 需求追踪关系构建方法、装置及计算机可读存储介质 (Demand tracking relationship construction method and device and computer readable storage medium ) 是由 张莉 田家豪 连小利 于 2021-08-16 设计创作,主要内容包括:本发明公开了一种需求追踪关系构建方法、装置及计算机可读存储介质。需求追踪关系构建方法,包括:对各个需求文档依次进行分词、句子成分分析和依存分析,以获取每个需求文档的结构化表示,其中,各个需求文档包括高层需求文档和低层需求文档;基于各个需求文档的结构化表示,确定同层需求文档间的关联关系以及不同层需求文档间所包含语义要素的匹配关系,并基于匹配关系,确定不同层需求文档间的追踪关系;基于同层需求文档间的关联关系,对追踪关系进行补充修正;基于补充修正后的追踪关系,结合向量空间模型所识别到的追踪关系,确定需求追踪关系。本发明可以提高构建追踪关系的准确率。(The invention discloses a demand tracing relation construction method and device and a computer readable storage medium. The demand tracing relation construction method comprises the following steps: carrying out word segmentation, sentence component analysis and dependency analysis on each demand document in sequence to obtain a structured representation of each demand document, wherein each demand document comprises a high-level demand document and a low-level demand document; determining an incidence relation between the requirement documents at the same layer and a matching relation of semantic elements contained in the requirement documents at different layers based on the structural representation of each requirement document, and determining a tracking relation between the requirement documents at different layers based on the matching relation; performing supplementary correction on the tracking relation based on the association relation between the files with the same layer requirement; and determining a demand tracking relation based on the supplemented and corrected tracking relation by combining the tracking relation identified by the vector space model. The method and the device can improve the accuracy of establishing the tracking relationship.)

需求追踪关系构建方法、装置及计算机可读存储介质

技术领域

本发明涉及软件需求管理领域,尤其涉及一种需求追踪关系构建方法、装置及计算机可读存储介质。

背景技术

需求追踪是一种描述和跟踪需求整个生命周期的能力,包括对需求的来源和实现进行跟踪,一条需求追踪关系标示了需求(源制品)和软件开发过程中其它制品(目标制品)间的一种双向关系。需求追踪关系被多项国际标准如DO-178C、IEEE Std.830-1988列为软件系统的必要项。

软件需求规格说明的获取,是以更高层次的需求如用户需求、客户需求以及行业规范等较为抽象的需求作为依据的,构建高层需求与低层需求间的追踪关系,可以为高层需求找到其在后续开发过程中的具体实现,并为低层需求溯源,进而支持软件项目管理中的多项关键活动,如变更管理,需求一致性、完整性分析等,使项目管理者更为高质高效的进行这些活动,保证系统的需求质量。

相关技术中,需求追踪关系通常以人工构建的需求追踪矩阵(RTM)来表示和存储,但RTM的构建过程费时费力、枯燥、易出错,对于大型复杂软件系统而言,此情况更为严重,导致其带来的开销可能会低于收益。而当前一些需求追踪关系的自动构建方法,其识别的追踪关系准确率较低,难以满足实际应用需求。

发明内容

本发明实施例提供一种需求追踪关系构建方法、装置及计算机可读存储介质,用以提高需求追踪关系的准确率。

根据本发明实施例的需求追踪关系构建方法,包括:

对各个需求文档依次进行分词、句子成分分析和依存分析,以获取每个所述需求文档的结构化表示,其中,所述各个需求文档包括高层需求文档和低层需求文档;

基于各个所述需求文档的结构化表示,确定同层需求文档间的关联关系以及不同层需求文档所包含语义要素间的匹配关系,并基于所述匹配关系,确定不同层需求文档间的追踪关系;

基于所述同层需求文档间的关联关系,对所述追踪关系进行补充修正;

基于补充修正后的追踪关系,结合向量空间模型所识别到的追踪关系,确定需求追踪关系。

根据本发明的一些实施例,所述获取每个所述需求文档的结构化表示,包括:

从所述需求文档中抽取多个包含关键文本信息的语义要素;

基于所述多个语义要素,构建所述需求文档的结构化表示。

根据本发明的一些实施例,所述多个语义要素包括:需求执行者、需求动作、执行需求动作所需的制品/数据、需求动作产出或改变的制品/数据、对需求动作的约束、触发需求动作的事件。

根据本发明的一些实施例,所述基于各个所述需求文档的结构化表示,确定同层需求文档间的关联关系以及不同层需求文档所包含语义要素间的匹配关系,包括:

基于所述需求文档的结构化表示,通过对同层需求文档间语义要素进行关系分析以及人工标注,确定同层需求文档间的关联关系;

基于所述需求文档的结构化表示,通过对不同层需求文档间语义要素进行相似度分析和匹配,确定不同层需求文档所包含语义要素间的匹配关系;

所述同层需求文档间的关联关系包括细化和前提。

根据本发明的一些实施例,所述通过对不同层需求文档间语义要素进行相似度分析和匹配,包括:

根据所述语义要素在其对应的需求文档中的角色和重要程度,确定所述高层需求文档中各个语义要素在所述低层需求文档中的匹配范围,其中,所述匹配范围包括多条语义要素对,每对所述语义要素对支持至少一个匹配方式,所述匹配方式包括:严格匹配、层次匹配、和抽象匹配;

基于所述匹配范围及其支持的匹配方式,借助领域知识库和通用词汇库,对不同层需求文档间语义要素进行相似度分析和匹配,并确定每条所述语义要素对的相关性,其中,所述语义要素对的相关性为所述语义要素对所支持的至少一个匹配方式所确定语义要素对相关程度的最大值。

根据本发明的一些实施例,所述基于所述匹配关系,确定不同层需求文档间的追踪关系,包括:

基于多条语义要素对,设计多条追踪关系构建规则;

判断所述高层需求文档与所述低层需求文档是否满足至少一条所述追踪关系构建规则,若是,则所述高层需求文档与所述低层需求文档间存在追踪关系,否则,所述高层需求文档与所述低层需求文档间不存在追踪关系;

计算存在追踪关系的高层需求文档与低层需求文档间的追踪关系置信度,所述追踪关系置信度为所述高层需求文档与所述低层需求文档间所有语义要素匹配对的相关性之和。

根据本发明的一些实施例,所述基于所述同层需求文档间的关联关系,对所述追踪关系进行补充修正,包括:

获取追踪关系置信度不小于阈值的所有追踪关系,并基于所述同层需求文档间的关联关系,将与这些追踪关系中高层需求文档存在细化关联关系的其他高层需求文档、以及与这些追踪关系中低层需求文档存在细化或前提关联关系的其他低层需求文档补充至所述追踪关系中。

根据本发明的一些实施例,所述基于补充修正后的追踪关系,结合向量空间模型所识别到的追踪关系,确定需求追踪关系,包括:

将补充修正后的追踪关系按置信度降序排列;

将向量空间模型所识别到的追踪关系按相似度降序排列并放置在所述补充修正后的追踪关系序列后,并去除重复追踪关系。

根据本发明实施例的需求追踪关系构建装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的需求追踪关系构建方法的步骤。

根据本发明实施例的计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如上所述的需求追踪关系构建方法的步骤。

本发明实施例通过确定需求文档的结构化表示,以及同层需求间的关联关系;根据所述结构化的不同层次需求中语义要素的匹配关系确定部分需求的追踪关系;根据所述同层需求建的关联关系补充和修正识别出的追踪关系;将补充修正后的追踪关系与VSM识别出的追踪关系进行合并,得到更完善的追踪关系。由此提高了构建追踪关系的准确率,取得了积极的技术效果。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的

具体实施方式

附图说明

通过阅读下文实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在附图中:

图1是本发明实施例中需求追踪关系构建方法流程图;

图2是本发明实施例中需求追踪关系构建方法流程图;

图3是本发明实施例中需求追踪关系构建装置组成示意图;

图4是本发明实施例中需求追踪关系构建设备组成示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

本发明第一方面实施例提出一种需求追踪关系构建方法,如图1所示,包括:

步骤1,对各个需求文档依次进行分词、句子成分分析和依存分析,以获取每个所述需求文档的结构化表示,其中,所述各个需求文档包括高层需求文档和低层需求文档;

步骤2,基于各个所述需求文档的结构化表示,确定同层需求文档间的关联关系以及不同层需求文档所包含语义要素间的匹配关系,并基于所述匹配关系,确定不同层需求文档间的追踪关系;

步骤3,基于所述同层需求文档间的关联关系,对所述追踪关系进行补充修正;

步骤4,基于补充修正后的追踪关系,结合向量空间模型所识别到的追踪关系,确定需求追踪关系。

向量空间模型(又称空间向量模型),Vector Space Model,是目前较为流行的基于信息检索的需求追踪方法。此方法将源制品(高层需求)和目标制品(低层需求),看做文本向量,并通过计算向量间的余弦相似度,设定阈值,超过特定阈值则判断为两条需求间存在追踪关系。此方法的召回率较高,但准确率较低,无法满足实际应用的需要。

本发明实施例通过确定需求文档的结构化表示,以及同层需求间的关联关系;根据所述结构化的不同层次需求中语义要素的匹配关系确定部分需求的追踪关系;根据所述同层需求建的关联关系补充和修正识别出的追踪关系;将补充修正后的追踪关系与VSM识别出的追踪关系进行合并,得到更完善的追踪关系。由此提高了构建追踪关系的准确率,取得了积极的技术效果。

在上述实施例的基础上,进一步提出各变型实施例,在此需要说明的是,为了使描述简要,在各变型实施例中仅描述与上述实施例的不同之处。

根据本发明的一些实施例,所述获取每个所述需求文档的结构化表示,包括:

从所述需求文档中抽取多个包含关键文本信息的语义要素;

基于所述多个语义要素,构建所述需求文档的结构化表示。

根据本发明的一些实施例,所述多个语义要素包括:需求执行者、需求动作、执行需求动作所需的制品/数据、需求动作产出或改变的制品/数据、对需求动作的约束、触发需求动作的事件。

根据本发明的一些实施例,所述基于各个所述需求文档的结构化表示,确定同层需求文档间的关联关系以及不同层需求文档间的匹配关系,包括:

基于所述需求文档的结构化表示,通过对同层需求文档间语义要素进行关系分析以及人工标注,确定同层需求文档间的关联关系;

基于所述需求文档的结构化表示,通过对不同层需求文档间语义要素进行相似度分析和匹配,确定不同层需求文档间的匹配关系;

所述同层需求文档间的关联关系包括细化和前提。

根据本发明的一些实施例,所述通过对不同层需求文档间语义要素进行相似度分析和匹配,包括:

根据所述语义要素在其对应的需求文档中的角色和重要程度,确定所述高层需求文档中各个语义要素在所述低层需求文档中的匹配范围,其中,所述匹配范围包括多条语义要素对,每对所述语义要素对支持至少一个匹配方式,所述匹配方式包括:严格匹配、层次匹配、和抽象匹配;

基于所述匹配范围及其支持的匹配方式,借助领域知识库和通用词汇库,对不同层需求文档间语义要素进行相似度分析和匹配,并确定每条所述语义要素对的相关性,其中,所述语义要素对的相关性为所述语义要素对所支持的至少一个匹配方式所确定语义要素对相关程度的最大值。

根据本发明的一些实施例,所述基于所述匹配关系,确定不同层需求文档间的追踪关系,包括:

基于多条语义要素对,设计多条追踪关系构建规则;

判断所述高层需求文档与所述低层需求文档是否满足至少一条所述追踪关系构建规则,若是,则所述高层需求文档与所述低层需求文档间存在追踪关系,否则,所述高层需求文档与所述低层需求文档间不存在追踪关系;

计算存在追踪关系的高层需求文档与低层需求文档间的追踪关系置信度,所述追踪关系置信度为所述高层需求文档与所述低层需求文档间所有语义要素匹配对的相关性之和。

根据本发明的一些实施例,所述基于所述同层需求文档间的关联关系,对所述追踪关系进行补充修正,包括:

获取追踪关系置信度不小于阈值的所有追踪关系,并基于所述同层需求文档间的关联关系,将与这些追踪关系中高层需求文档存在细化关联关系的其他高层需求文档、以及与这些追踪关系中低层需求文档存在细化或前提关联关系的其他低层需求文档,在避免重复的前提下,补充至所述追踪关系中。

根据本发明的一些实施例,所述基于补充修正后的追踪关系,结合向量空间模型所识别到的追踪关系,确定需求追踪关系,包括:

将补充修正后的追踪关系按置信度降序排列;

将向量空间模型所识别到的追踪关系按相似度降序排列并放置在所述补充修正后的追踪关系序列后,并去除重复追踪关系。

下面参照图2以一个具体的实施例详细描述根据本发明实施例的需求追踪关系构建方法。值得理解的是,下述描述仅是示例性说明,而不是对本发明的具体限制。凡是采用本发明的相似结构及其相似变化,均应列入本发明的保护范围。

本发明实施例的需求追踪关系构建方法,如图2所示,包括以下具体步骤:

S101、通过分词,句子成分分析和依存分析确定需求文本的结构化表示,以及同层各需求条目间的关联关系;

S102、对所述结构化需求中各语义要素间进行语义匹配,确定不同层次的部分需求间的追踪关系;

S103、根据所述同层需求间的关联关系推理,对所述需求间的部分追踪关系进行补充修正;

S104、将补充修正后的追踪关系与向量空间模型(VSM)所得追踪关系结果整合,确定更加完善的需求追踪关系。

其中,通过分词,句子成分分析和依存分析确定需求文本的结构化表示,以及同层各需求条目间的关联关系,包括:

对需求文本进行分词,句子成分分析和依存关系分析,抽取其中关键的结构化语义要素,得到每条需求文本的结构化表示;

通过同层需求间特定语义要素的关系分析以及人工标注,确定同层需求条目间的关联关系集合。

具体地说,本实施例中,需求结构化算法输入制品为一个高层需求集和一个低层需求集合,输出制品为每条需求的结构化表示。对高层需求和低层需求集合中所有的需求文本,通过分词,句子成分分析和依存关系分析,抽取其中包含关键文本信息的结构化语义要素,将每一条需求表示为包含六种语义要素的六元组:<agent,operation,input,output,constraint,event>,下表1是对这六种语义要素的定义。

表1结构化需求中语义要素的定义

本实施例中,需求关联关系抽取方法的输入制品为一个结构化的高层需求集合,及一个结构化的低层需求集合,输出为高层需求条目间的关联关系和低层需求间的关联关系。通过同层需求间特定语义要素的关系分析以及人工标注,确定同层需求条目间的关联关系,主要识别同层需求间的“细化”和“前提”两种关联关系。具体的说,关联关系识别分别在高层需求间和低层需求间进行,其中‘细化’关系的识别方法为,对于需求条目Reqa,处于其子目录/子节点下的所有相关需求,或其他对Reqa进行更详细的描述的任意需求Reqi,都被识别为这样的关联关系:Reqi“细化”Reqa(或Reqa“包含”Reqi)。对“前提”关系的识别方法是,若Reqa.event==Reqj.operation,即当Reqj是Reqa的触发事件时,则有Reqj“前提”Reqa(或Reqa“依赖”Reqj)。

对所述不同层次结构化需求中各语义要素进行匹配,包括:

根据所述结构化需求中具体语义要素在句子中的角色和重要程度,确定高层需求中的各语义要素在低层需求中的匹配范围;

根据领域知识和通用词汇关系,定义三种不同精确程度的匹配方式,及每种匹配方式的适用范围,确定高层需求中各语义要素的匹配结果。

根据领域知识和通用词汇关系,定义三种不同精确程度的匹配方式,包括:

严格匹配,即当一对语义要素在文字上相同或在领域知识或通用词汇库中有“近/同义词”关系时,匹配成功,否则匹配失败。

层次匹配,即当一对语义要素在领域知识或通用词汇库中有“泛化”、“上/下位”,“蕴含”等关系时,匹配成功,否则匹配失败;

抽象匹配,即当一个语义要素中包含所标记的抽象词汇时,匹配成功,否则匹配失败。

确定高层需求中语义要素的匹配范围和匹配方式之后,还包括:

为每种匹配方式规定返回值,以标记所匹配语义要素间的相关程度;

将每一条高层需求作为查询语句,遍历低层需求,判断此高层需求与各低层需求的追踪关系;

按照高层需求中各语义要素在一条低层需求的匹配结果,确定该高层需求与低层需求间是否存在追踪关系。

若二者之间存在追踪关系,则累加各语义要素的相关性的值,此值作为此条追踪关系的可信度标记。

具体地说,本实施例在前述需求结构化表示的基础上,借助领域知识库和通用词汇库WordNet对结构化需求条目中的语义要素进行相似度分析和匹配,从而识别需求间的追踪关系。领域知识库中标识了较为抽象的词汇表,存储在abstrat wordlist中,且定义了领域词汇间的泛化、属性、近义/同义,蕴含等关系;WordNet中则标识了通用词汇间的蕴含、近义/同义及上下位关系,并提供了通用词汇间的相似度计算接口,即WordNet.wup_similarity。本实施例中定义了三种语义要素匹配模式:严格匹配,层次化匹配和抽象匹配,并为每种匹配定义了一个返回值rel,用以表示所匹配的一对词汇间的相关程度,其具体设置如下表2所示。

表2语义要素匹配模式

本实施例中的语义要素匹配算法输入为结构化的高层需求集合和低层需求集合,以每条结构化的高层需求作为查询语句,检查其中包含的各语义要素与低层需求中包含的各语义要素是否能通过特定的匹配模式匹配成功。为了确定各语义要素的匹配范围,规定了16对需要匹配的语义要素对(Semantic Element Pair,SEP)。对于一条高层需求HLR,和一条低层需求LLR,为了确定二者间追踪关系,要进行的语义要素匹配,如下表3所示。

表3构建追踪关系需要匹配的的语义要素对

其中,为了记录每个语义要素对的相关程度,用其所支持的各匹配模式返回的rel的最大值来标记其语义相关性。

通过前述的匹配方法和匹配范围,确定了高层需求和低层需求中,P1-P16的匹配关系,在此基础上,定义了需求追踪关系构建方法,包含如下的15条规则:

R1:P1>0AND P4>0AND(P5>0OR P6>0)

R2:P1>0AND P7>0AND(P8>0OR P9>0)

R3:P2>0AND P4>0AND P6>0

R4:P3>0AND P4>0AND P5>0

R5:P1>0AND P7>0AND(P8>0OR P9>0)

R6:P1>=0.5AND P10>0AND P11>0

R7:R1 AND(P12>0OR P13>0)

R8:(R5 OR R6)AND(P12>0OR P13>0)

R9:R1 AND P14>0AND P15>0

R10:R1 AND P15>0AND P16>0

R11:(R5 OR R6)AND P14>0AND P15>0

R12:(R5 OR R6)AND P15>0AND P16>0

R13:(R9 OR R10)AND(P12>0OR P13>0)

R14:(R11 OR R12)AND(P12>0OR P13>0)

R15:P1>0AND P4>0AND P9>0.5

此方法的输入为一条高层需求和一条低层需求的语义要素匹配结果,输出为此两条需求间追踪关系的存在性。具体的说,该方法制定了基于语义要素匹配结果的追踪关系构建规则,并根据高层需求中具体存在的语义要素,来确定应该使用哪些规则。

对于特定形式的高层需求与低层需求,当其满足任意一条对应的规则时,则二者间存在追踪关系;

若不满足所有适用规则,则其间不存在追踪关系。

同时,若二者存在追踪关系,则该追踪关系的置信度为高层需求中各语义要素与相应的低层需求中语义要素匹配时,各语义要素对的rel累加的值。

具体高层需求组成形式与其对应的规则适用范围如下表4所示。

表4不同规则的适用范围

根据同层需求间的关联关系,对所述部分需求间的追踪关系进行补充修正,包括:

遍历所有可信度超过一定阈值的追踪关系,对其中的高层需求,遍历高层需求间的关联关系,找到与其有关联关系的其他高层需求,记录关联关系类型;

对所有出现在追踪关系中的低层需求,遍历低层需求间的关联关系,找到与其有关联关系的其他低层需求,记录关联关系类型;

根据具体的关联关系类型,在所述的识别出的需求追踪关系的基础上,进行推理,得到新的追踪关系。

根据具体的关联关系类型,在所述的识别出的需求追踪关系的基础上,进行推理,得到新的追踪关系,包括:

若某高层需求出现在需求追踪关系中,且此高层需求与其他高层需求间存在“细化”关联关系,则追踪关系传播至其他高层需求。

若某低层需求出现在需求追踪关系中,且次低层需求与其他低层需求间存在“细化”或“前提”关联关系,则追踪关系传播至其他低层需求。

对于前述由语义要素和规则的得到的追踪关系,本发明基于前述同层需求间的“细化”,“前提”关联关系对其进行补充修正。本实施例中追踪关系补充修正方法的输入为高层需求间的关联关系集,低层需求间的关联关系集,以及高层需求与低层需求间的追踪关系集,输出为更多追踪关系。首先,遍历前述识别出的追踪关系,对于每一条追踪关系<HLRi,LLRi>,若追踪关系的可信性大于或等于0.8,则,

1)对其中的源节点即高层需求HLRi做以下操作:

遍历高层需求间的关联关系,找出所有满足以下条件的HLRj:HLRi细化HLRj;

检查<HLRj,LLRi>是否存在于前述的追踪关系集中,若存在,则不做操作,若不存在,则补充加入至追踪关系集中;

2)对其中的目标节点即低层需求LLRi做以下操作:

遍历低层需求间的关联关系,找出所有满足以下条件的LLRj:LLRi细化LLRj;

遍历低层需求间的关联关系,找出所有满足以下条件的LLRj:LLRj前提LLRi;

检查<HLRi,LLRj>是否存在于前述的追踪关系集中,若存在,则不做操作,若不存在,则补充加入至追踪关系集中;

由以上方法,对前述高层需求与低层需求的追踪关系集合进行补充修正。

将所述需求追踪关系与采用“向量空间模型(VSM)”识别到的追踪关系整合,确定更加完善的需求追踪关系,包括:

将VSM识别到的追踪关系,按相似度降序排列;

将权利要求书6中所述追踪关系按可信度降序排列,并放置到VSM所得结果之前;

去除VSM结果中重复的追踪关系。

向量空间模型,Vector Space Model,是目前较为流行的基于信息检索的需求追踪方法。此方法将源制品(高层需求)和目标制品(低层需求),看做文本向量,并通过计算向量间的余弦相似度,设定阈值,超过特定阈值则判断为两条需求间存在追踪关系。此方法的召回率较高,但准确率较低,无法满足实际应用的需要。本实施例中将前述完善后的需求追踪关系集与用VSM识别出的追踪关系集按一定方式进行排序和整合,从而得到更加高质量的追踪关系集。

具体的说,本实施例中将前述补充修正后的追踪关系条目按照可信度降序排列。并将采用当前流行方法VSM识别出的需求追踪关系按照文本相似度降序排列,并放置在前述补充修正后追踪关系序列的尾部,若VSM结果列表中的追踪关系在前述补充修正后的追踪关系序列中已出现过,则为了避免重复将其删除。

综上,本发明定义了需求追踪关系构建方法,引入了细粒度语义要素匹配方法和基于语义要素匹配的追踪关系识别规则,能够更加准确地构建高层需求与低层需求间的追踪关系。同时,本发明还引入了通过同层需求间关联关系对追踪关系补充修正的方法,以及与VSM追踪关系构建结果的合并方法,能够提高追踪关系集的质量,特别是大幅度提升了准确率。

与当前流行的需求追踪关系自动构建方法相比,本发明实施例识别出了高层需求和低层需求间68%的追踪关系,所构建追踪关系的准确率可达71%,相比当前流行方法VSM有40%以上的准确率提升。

需要说明的是,以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

本发明第二方面实施例提出一种需求追踪关系构建装置1000,如图3所示,包括:存储器1010、处理器1020及存储在所述存储器1010上并可在所述处理器1020上运行的计算机程序,所述计算机程序被所述处理器1020执行时实现如上所述的第一方面各实施例所述需求追踪关系构建方法的步骤。

本发明第三方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器执行时实现如上所述的第一方面各实施例所述的需求追踪关系构建方法的步骤。

需要说明的是,本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。所述程序被处理器可以是手机,计算机,服务器,空调器,或者网络设备等。

本发明第四方面实施例提出一种需求追踪关系构建设备,如图4所示,包括:

预处理单元,用于对需求文档进行结构化,以及抽取需求间的关联关系;

追踪关系识别单元,用于根据结构化需求中各语义要素的匹配关系确定需求间的追踪关系;

补充修正单元,用于根据同层需求间的关联关系,对识别出的追踪关系进行推理,做出补充和修正。

结果合并单元,用于将补充修正后的追踪关系与VSM识别出的追踪关系进行合并,得到更完善的追踪关系。

本发明实施例通过确定需求文档的结构化表示,以及同层需求间的关联关系;根据所述结构化的不同层次需求中语义要素的匹配关系确定部分需求的追踪关系;根据所述同层需求建的关联关系补充和修正识别出的追踪关系;将补充修正后的追踪关系与VSM识别出的追踪关系进行合并,得到更完善的追踪关系。由此提高了构建追踪关系的准确率,取得了积极的技术效果。

在上述实施例的基础上,进一步提出各变型实施例,在此需要说明的是,为了使描述简要,在各变型实施例中仅描述与上述实施例的不同之处。

在本发明的一些实施例中,预处理单元,用于通过分词,句子成分分析和依存分析确定需求文本的结构化表示,以及同层各需求条目间的关联关系,具体包括:

对需求文本进行分词,句子成分分析和依存关系分析,抽取其中关键的结构化语义要素,得到每条需求文本的结构化表示;

通过同层需求间特定语义要素的关系分析以及人工标注,确定同层需求条目间的关联关系集合。

具体地说,本实施例中,需求结构化算法输入制品为一个高层需求集和一个低层需求集合,输出制品为每条需求的结构化表示。对高层需求和低层需求集合中所有的需求文本,通过分词,句子成分分析和依存关系分析,抽取其中包含关键文本信息的结构化语义要素,将每一条需求表示为包含六种语义要素的六元组:<agent,operation,input,output,constraint,event>,下表1是对这六种语义要素的定义。

表1结构化需求中语义要素的定义

本实施例中,需求关联关系抽取方法的输入制品为一个结构化的高层需求集合,及一个结构化的低层需求集合,输出为高层需求条目间的关联关系和低层需求间的关联关系。通过同层需求间特定语义要素的关系分析以及人工标注,确定同层需求条目间的关联关系,主要识别同层需求间的“细化”和“前提”两种关联关系。具体的说,关联关系识别分别在高层需求间和低层需求间进行,其中‘细化’关系的识别方法为,对于需求条目Reqa,处于其子目录/子节点下的所有相关需求,或其他对Reqa进行更详细的描述的任意需求Reqi,都被识别为这样的关联关系:Reqi“细化”Reqa(或Reqa“包含”Reqi)。对“前提”关系的识别方法是,若Reqa.event==Reqj.operation,即当Reqj是Reqa的触发事件时,则有Reqj“前提”Reqa(或Reqa“依赖”Reqj)。

其中,在本发明的一些示例中,对所述不同层次结构化需求中各语义要素进行匹配,包括:

根据所述结构化需求中具体语义要素在句子中的角色和重要程度,确定高层需求中的各语义要素在低层需求中的匹配范围;

根据领域知识和通用词汇关系,定义三种不同精确程度的匹配方式,及每种匹配方式的适用范围,确定高层需求中各语义要素的匹配结果。

根据领域知识和通用词汇关系,定义三种不同精确程度的匹配方式,包括:

严格匹配,即当一对语义要素在文字上相同或在领域知识或通用词汇库中有“近/同义词”关系时,匹配成功,否则匹配失败。

层次匹配,即当一对语义要素在领域知识或通用词汇库中有“泛化”、“上/下位”,及“蕴含”等关系时,匹配成功,否则匹配失败;

抽象匹配,即当一个语义要素中包含所标记的抽象词汇时,匹配成功,否则匹配失败。

确定高层需求中语义要素的匹配范围和匹配方式之后,还包括:

为每种匹配方式规定返回值,以标记所匹配语义要素间的相关程度;

将每一条高层需求作为查询语句,遍历低层需求,判断此高层需求与各低层需求的追踪关系;

按照高层需求中各语义要素在一条低层需求的匹配结果,确定该高层需求与低层需求间是否存在追踪关系。

若二者之间存在追踪关系,则累加各语义要素的相关性的值,此值作为此条追踪关系的可信度标记。

具体地说,本实施例在前述需求结构化表示的基础上,借助领域知识库和通用词汇库WordNet对结构化需求条目中的语义要素进行相似度分析和匹配,从而识别需求间的追踪关系。领域知识库中标识了较为抽象的词汇表,存储在abstrat wordlist中,且定义了领域词汇间的泛化、属性、近义/同义,蕴含等关系;WordNet中则标识了通用词汇间的蕴含、近义/同义及上下位关系,并提供了通用词汇间的相似度计算接口,即WordNet.wup_similarity。本实施例中定义了三种语义要素匹配模式:严格匹配,层次化匹配和抽象匹配,并为每种匹配定义了一个返回值rel,用以表示所匹配的一对词汇间的相关程度,其具体设置如下表2所示。

表2语义要素匹配模式

本实施例中的语义要素匹配算法输入为结构化的高层需求集合和低层需求集合,以每条结构化的高层需求作为查询语句,检查其中包含的各语义要素与低层需求中包含的各语义要素是否能通过特定的匹配模式匹配成功。为了确定各语义要素的匹配范围,规定了16对需要匹配的语义要素对(Semantic Element Pair,SEP)。对于一条高层需求HLR,和一条低层需求LLR,为了确定二者间追踪关系,要进行的语义要素匹配,如下表3所示:

表3构建追踪关系需要匹配的的语义要素对

其中,为了记录每个语义要素对的相关程度,用其所支持的各匹配模式返回的rel的最大值来标记其语义相关性。

通过前述的匹配方法和匹配范围,确定了高层需求和低层需求中,P1-P16的匹配关系,在此基础上,定义了需求追踪关系构建方法,包含如下的15条规则:

R1:P1>0AND P4>0AND(P5>0OR P6>0)

R2:P1>0AND P7>0AND(P8>0OR P9>0)

R3:P2>0AND P4>0AND P6>0

R4:P3>0AND P4>0AND P5>0

R5:P1>0AND P7>0AND(P8>0OR P9>0)

R6:P1>=0.5AND P10>0AND P11>0

R7:R1 AND(P12>0OR P13>0)

R8:(R5 OR R6)AND(P12>0OR P13>0)

R9:R1 AND P14>0AND P15>0

R10:R1 AND P15>0AND P16>0

R11:(R5 OR R6)AND P14>0AND P15>0

R12:(R5 OR R6)AND P15>0AND P16>0

R13:(R9 OR R10)AND(P12>0OR P13>0)

R14:(R11 OR R12)AND(P12>0OR P13>0)

R15:P1>0AND P4>0AND P9>0.5

此方法的输入为一条高层需求和一条低层需求的语义要素匹配结果,输出为此两条需求间追踪关系的存在性。具体的说,该方法制定了基于语义要素匹配结果的追踪关系构建规则,并根据高层需求中具体存在的语义要素,来确定应该使用哪些规则。

对于特定形式的高层需求与低层需求,当其满足任意一条对应的规则时,则二者间存在追踪关系;

若不满足所有适用规则,则其间不存在追踪关系。

同时,若二者存在追踪关系,则该追踪关系的置信度为高层需求中各语义要素与相应的低层需求中语义要素匹配时,各语义要素对的rel累加的值。

具体高层需求组成形式与其对应的规则适用范围如下表4所示。

表4不同规则的适用范围

在本发明的一些实施例中,补充修正单元,用于:

遍历所有可信度超过一定阈值的追踪关系,中的高层需求,遍历高层需求间的关联关系,找到与其有关联关系的其他高层需求,记录关联关系类型;

对所有出现在追踪关系中的低层需求,遍历低层需求间的关联关系,找到与其有关联关系的其他低层需求,记录关联关系类型;

根据具体的关联关系类型,在所述的识别出的需求追踪关系的基础上,进行推理,得到新的追踪关系。

其中,根据具体的关联关系类型,在所述的识别出的需求追踪关系的基础上,进行推理,得到新的追踪关系,包括:

若某高层需求出现在需求追踪关系中,且此高层需求与其他高层需求间存在“细化”关联关系,则追踪关系传播至其他高层需求。

若某低层需求出现在需求追踪关系中,且次低层需求与其他低层需求间存在“细化”或“前提”关联关系,则追踪关系传播至其他低层需求。

对于前述由语义要素和规则的得到的追踪关系,本发明基于前述同层需求间的“细化”,“前提”关联关系对其进行补充修正。本实施例中追踪关系补充修正方法的输入为高层需求间的关联关系集,低层需求间的关联关系集,以及高层需求与低层需求间的追踪关系集,输出为更多追踪关系。首先,遍历前述识别出的追踪关系,对于每一条追踪关系<HLRi,LLRi>,若追踪关系的可信性大于或等于0.8,则:

1)对其中的源节点即高层需求HLRi做以下操作:

遍历高层需求间的关联关系,找出所有满足以下条件的HLRj:HLRi细化HLRj;

检查<HLRj,LLRi>是否存在于前述的追踪关系集中,若存在,则不做操作,若不存在,则补充加入至追踪关系集中;

2)对其中的目标节点即低层需求LLRi做以下操作:

遍历低层需求间的关联关系,找出所有满足以下条件的LLRj:LLRi细化LLRj;

遍历低层需求间的关联关系,找出所有满足以下条件的LLRj:LLRj前提LLRi;

检查<HLRi,LLRj>是否存在于前述的追踪关系集中,若存在,则不做操作,若不存在,则补充加入至追踪关系集中;

由以上方法,对前述高层需求与低层需求的追踪关系集合进行补充修正。

在本发明的一些实施例中,结果合并单元,用于:

将VSM识别到的追踪关系,按相似度降序排列;

将上述步骤补充和修正后的追踪关系按可信度降序排列,并放置到VSM所得结果之前;

去除VSM结果中重复的追踪关系。

向量空间模型,Vector Space Model,是目前较为流行的基于信息检索的需求追踪方法。此方法将源制品(高层需求)和目标制品(低层需求),看做文本向量,并通过计算向量间的余弦相似度,设定阈值,超过特定阈值则判断为两条需求间存在追踪关系。此方法的召回率较高,但准确率较低,无法满足实际应用的需要。本实施例中将前述完善后的需求追踪关系集与用VSM识别出的追踪关系集按一定方式进行排序和整合,从而得到更加高质量的追踪关系集。

具体的说,本实施例中将前述补充修正后的追踪关系条目按照可信度降序排列。并将采用当前流行方法VSM识别出的需求追踪关系按照文本相似度降序排列,并放置在前述补充修正后追踪关系序列的尾部,若VSM结果列表中的追踪关系在前述补充修正后的追踪关系序列中已出现过,则为了避免重复将其删除。

与当前流行的需求追踪关系自动构建方法相比,本发明实施例识别出了高层需求和低层需求间68%的追踪关系,所构建追踪关系的准确率可达71%,相比当前流行方法VSM有40%以上的准确率提升。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

24页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种自定义元数据与持久化实例映射方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!