一种基于多属性决策的复杂网络关键模体挖掘的方法

文档序号:86222 发布日期:2021-10-08 浏览:33次 >En<

阅读说明:本技术 一种基于多属性决策的复杂网络关键模体挖掘的方法 (Method for mining key motif of complex network based on multi-attribute decision ) 是由 杨云云 张辽 冯彪 郝晓亮 谢珺 赵文晶 任密蜂 于 2021-08-03 设计创作,主要内容包括:本发明公开了一种基于多属性决策的复杂网络关键模体挖掘的方法。本发明通过结合模体理论和节点重要性挖掘来综合评估模体的重要性,提出了一种整合多种拓扑属性对网络模体重要性进行识别的方法。通过识别的模体可以揭示重要模体对网络特定结构和功能的影响,本发明从介观层面剖析网络的结构特征,结果可以作为研究和分析复杂系统动力学的辅助工具,特别是对于控制复杂系统具有重要的意义。(The invention discloses a method for mining a key motif of a complex network based on multi-attribute decision. The invention provides a method for identifying the importance of network motifs by integrating various topological attributes by comprehensively evaluating the importance of motifs by combining motif theory and node importance mining. The influence of important motifs on the specific structure and function of the network can be revealed through the identified motifs, the structural characteristics of the network are analyzed from a mesoscopic level, and the result can be used as an auxiliary tool for researching and analyzing the dynamics of a complex system, and particularly has important significance for controlling the complex system.)

一种基于多属性决策的复杂网络关键模体挖掘的方法

技术领域

本发明涉及复杂网络关键模体的挖掘方法,具体为一种基于多属性决策的复杂网络关键模体挖掘的方法。

背景技术

模体是存在于网络中的重要结构,且具有相互作用的基本模式。模体的概念于2002年由Milo等人首次提出模体的概念。相较于网络中不属于模体的子图结构,模体从局部刻画了给定网络相互连接的特定模式,对于刻画网络的组织方式以及研究网络的全局构成具有重要的作用。在给定网络中,如果一种连通子图结构出现的次数远大于其在具有相同度分布的随机网络中的次数,并且出现的次数大于一个阈值,称这种连通子图为模体。

模体是高阶网络结构的一种表现形式。基于成对交互的模型可能无法捕获网络节点之间的复杂依存关系。而模体作为一种高阶网络模型超越了这些限制。模体可以更加精确地描述网络内部连接地特定模式,同时简化网络结构。网络模体的研究也从生物学、数学扩展到物理学和社会科学等众多学科,为理解复杂系统提供了一个全新的视角。

复杂网络中对于重要信息的挖掘,主要是从节点、边等微观的角度上进行研究,而模体可以从介观的角度对网络特性进行分析。研究表明在实际网络中如蛋白质网络等都存在大量种类的模体,网络的动力学特征或节点所表现的特性往往是依赖于其所位于的模体之上,且不同种类,不同位置的模体对于网络结构或网络功能所起的作用也大有不同。因此如何准确、高效地识别出一些具有关键作用的模体是一个需要解决的科学问题。

发明内容

基于目前对于重要信息的挖掘主要针对于节点等微观信息,本发明考虑到网络的模体特性及其对网络结构和功能的异质性,从粗粒度的角度以模体为对象研究了网络结构元素的重要性,提供一种基于多属性决策的网络关键模体识别方法。

本发明是采用如下技术方案实现的:

一种基于多属性决策的复杂网络关键模体识别的方法,包括如下步骤:

一、建立输入网络模型:将研究对象假设为节点,对象之间的特定关系假设为边,形成网络模型G=(N,M),表示网络中有N个节点、M条边;根据网络中点和边的信息得到网络的邻接矩阵A=(aij)N×N,若存在由j指向i的链接,则令aij=1,否则aij=0。

二、搜索网络中存在的模体结构:首先确定需要寻找的模体包含的节点数,选取三节点或四节点的模体进行分析,对目标网络构建多个具有相同度分布的随机网络,采用ESU方法枚举网络中各类子图的数目,与构成的随机网络中进行对比。采用Z得分即显著性水平来对子图做出评价,Z得分公式为其中Nreal为目标网络中子图出现的次数,为随机网络中子图出现次数的平均,分母σrand与目标网络具有相同度分布的多个随机网络中子图出现次数的标准差。当Z>0时认为该子图结构为模体,Z值越大说明该类模体越重要。

三、选定模体结构:采取步骤二的方法得到三节点或四节点各类模体的Z得分,选取其中Z得分最高的模体种类作为待分析的模体目标,并列出具有该模体结构的节点组集合。

四、根据复杂网络的拓扑结构,选取不同的节点重要性指标:

分别选取节点度中心性D(i)、介数中心性BC(i)以及改进K核K(i)。

度中心性(D):考虑节点一阶邻居的数量对节点的影响;

介数中心性(BC):基于最短路径针对网络图中心性的衡量标准之一,如果一个节点是网络中其他节点对之间通信的必经之路,则其在网络中具有重要地位。节点介数中心性的值越高,则该节点就越重要;

改进K核:普通K-shell给出了一种节点重要性的粗粒度划分,通过一层层的剥离节点,最后处于内部的节点具有更大的中心性。而改进K-shell相较于一般的K-shell算法,具有更加细致的划分,使处于同一层的节点具有不同的重要性。

五、得到模体指标矩阵

1)计算网络中各个节点的度中心性(D),介数中心性(BC),改进K-shell中心性(IKS);

其中ki为节点i的度,N为网络的节点数目,分母(N–1)为节点可能的最大度值。

其中gjk(i)表示节点j和k之间通过节点i的最短路径的条数;gjk为从节点j到节点k之间所有最短路径的总数。

其中KS(i)代表节点i的普通K壳中心性值,Iter(i)表示剥离节点i时的迭代次数,kmax代表网络中度最大的节点的度值。

2)计算每个模体的度中心性(D),介数中心性(BC),改进K-shell中心性(IKS);

根据步骤三得到的节点组集合,结合1)得到的每个节点的三种重要性指标,将每个节点组中所有节点的三种中心性分别取平均,以此作为每个模体的度中心性值、介数中心性值以及改进K核平均值。

3)得到模体指标矩阵

根据模体的三种指标值,每个模体按行排列,每个模体的三种指标分别按列表示。最后得到一个模体指标矩阵W,共有n行3列,n行表示共有n个模体,3列分别表示度中心性平均值、介数中心性平均值以及改进K核平均值。用wij表示第i个模体的第j个属性值。

六、利用熵来确定各个指标的权重

1)根据步骤五得到的模体指标矩阵,对每一列的数据进行归一化处理,这里采用极差归一化方法:

其中,wij为第i个模体的第j个属性,为第j个属性的最小值,为第j个属性的最大值;最后得到归一化矩阵Bn×3

2)设三个属性的指标的权重表示为μ={μ123},根据香农熵理论,每个属性的熵可以根据下式计算:

其中,bij为第i个模体的第j个属性的归一化值,ej表示第j个属性的熵。

3)根据2)得到的各个属性的熵值,计算每个属性的权重:

七、对模体的重要性进行排序

按下式计算每个模体的重要性:

模体计算得到的s值越大,代表该模体越重要;最后对模体从大到小进行排序,输出集合Q。

本发明在现有的理论研究基础上,进一步结合了网络模体相关知识,将对网络节点重要性的研究方法类比推广到对网络中关键模体的挖掘上。本发明从节点的度中心性、介数中心性、位置因素三个属性入手实现了对网络模体重要性的数学刻画,从介观的角度剖析了网络的结构特征,为深入研究和分析复杂网络动力学提供了新的视角。同时,本发明综合考虑了影响模体重要性的多个属性,避免了只从单一角度分析问题带来的弊端,提高了研究结果的可靠性。

本发明设计合理,通过结合模体理论和节点重要性挖掘来综合评估模体的重要性,提出了一种整合多种拓扑属性对网络模体重要性进行识别的方法,具有很好的实际应用价值。

附图说明

图1表示关键节点簇挖掘的流程图。

图2表示小型无向网络的示例图。

图3表示三节点无向模体的示例图。

图4表示ESU方法枚举子图的实例图。

具体实施方式

下面结合附图对本发明的具体实施例进行详细说明。

一种基于多属性决策的复杂网络关键模体挖掘的方法,如图1所示,包括以下步骤:

一、以图2中的小型网络为例,形成网络模型G=(N,M),表示网络中有N个节点、M条边;根据网络中点和边的信息得到网络的邻接矩阵A=(aij)N×N,若存在由j指向i的链接,则令aij=1,否则aij=0。

二、搜索网络中存在的模体结构

确定需要寻找的模体包含的节点数,由于模体搜索计算量很大,一般选取三节点或四节点的模体进行分析,本发明实施例主要针对无向网络中的模体进行挖掘,这里以三节点无向模体为例,图3为三节点无向模体示例。对目标网络构建多个具有相同度分布的随机网络,采用ESU方法枚举网络中各类子图的数目,ESU方法主要分为网络构建、枚举子图、子图同构比较以及统计子图结果这四个步骤。具体来讲就是将节点进行编号后,基于序号值的方式对子图进行构建,在过程中只记录比该节点大的邻居节点,以防止搜索过程中子图的重复,并将新加入的节点其符合条件的邻居节点也加入代搜索集合。图4为ESU方法枚举子图的一个具体例子。得到子图统计结果后与构成的随机网络中进行对比。采用Z得分即显著性水平来对子图做出评价,Z得分公式为其中Nreal为目标网络中子图出现的次数,为随机网络中子图出现次数的平均,分母σrand与目标网络具有相同度分布的多个随机网络中子图出现次数的标准差。当Z>0时认为该子图结构为模体。Z值越大说明该类模体越重要;经过计算得到两种模体的Z得分如表1所示。

表1两类模体的Z得分

三、选定模体结构

根据步骤二的方法得到三节点模体的Z得分,选取其中Z得分最高的模体结构作为目标,即全闭合三角形模体结构。并列出具有该模体结构的三节点组集合。

四、根据复杂网络的拓扑结构,选取不同的节点重要性指标

分别选取节点度中心性D(i),介数中心性BC(i)以及改进K核K(i)。

度中心性(D):考虑节点一阶邻居的数量对节点的影响。

介数中心性(BC):基于最短路径针对网络图中心性的衡量标准之一,如果一个节点是网络中其他节点对之间通信的必经之路,则其在网络中具有重要地位。节点介数中心性的值越高,则该节点就越重要。

改进K核:普通K-shell给出了一种节点重要性的粗粒度划分,通过一层层的剥离节点,最后处于内部的节点具有更大的中心性。而改进K-shell相较于一般的K-shell算法,具有更加细致的划分,使处于同一层的节点具有不同的重要性。

五、得到模体指标矩阵

1)计算网络中各个节点的度中心性(D),介数中心性(BC),改进K-shell中心性(IKS);

其中ki为节点i的度,N为网络的节点数目,分母(N–1)为节点可能的最大度值。

其中gjk(i)表示节点j和k之间通过节点i的最短路径的条数;gjk为从节点j到节点k之间所有最短路径的总数。

其中KS(i)代表节点i的普通K壳中心性值,Iter(i)表示剥离节点i时的迭代次数,kmax代表网络中度最大的节点的度值。

2)计算每个模体的度中心性(D),介数中心性(BC),改进K-shell中心性(IKS);

根据步骤三得到的节点组集合,结合1)得到的每个节点的三种重要性指标,将每个节点组中三个节点的三种中心性分别取平均,以此作为每个模体的度中心性值、介数中心性值以及改进K核平均值。

3)得到模体指标矩阵

根据模体的三种指标值,每个模体按行排列,每个模体的三种指标分别按列表示。最后得到一个模体指标矩阵W,共有n行3列,n行表示共有n个模体,3列分别表示度中心性平均值、介数中心性平均值以及改进K核平均值。用wij表示第i个模体的第j个属性值。

六、利用熵来确定各个指标的权重

1)根据步骤五得到的模体指标矩阵,对每一列的数据进行归一化处理,采用极差归一化方法:

其中,wij为第i个模体的第j个属性,为第j个属性的最小值,为第j个属性的最大值;最后得到归一化矩阵Bn×3

2)设三个属性的指标的权重表示为μ={μ123},根据香农熵理论,每个属性的熵可以根据下式计算:

其中,bij为第i个模体的第j个属性的归一化值,ej表示第j个属性的熵。

3)根据2)得到的各个属性的熵值,计算每个属性的权重:

七、对模体的重要性进行排序

按下式计算每个模体的重要性:

模体计算得到的s值越大,代表该模体越重要。表2为各个模体的重要性值。最后对模体从大到小进行排序,输出集合Q。

表2各个模体的重要性值

摸体编号 综合重要性值
(7,8,10) 20.0073
(10,12,13) 11.6936
(10,12,15) 14.9379
(10,11,12) 11.6936
(11,12,13) 2.6178
(10,11,13) 11.2309

八、为了验证方法的有效性,将该方法的结果与删除三阶模体之后网络的离散程度DF进行比较。删除方法为:在原始网络中删除构成某一个模体的节点,同时删除包含这些节点的连边。离散度DF可由下式计算:

其中,dij表示节点i和j之间的最短路径,DF∈[0,1],且DF值越大,网络的离散程度越大。表3为计算的删除模体后的网络离散度与本方法得到的重要性排序对比。可以看出二者具有一致性。

表3删除模体后的网络离散度与本方法结果对比

本发明通过识别的模体可以揭示重要模体对网络特定结构和功能的影响,从介观层面剖析网络的结构特征,结果可以作为研究和分析复杂系统动力学的辅助工具,特别是对于控制复杂系统具有重要的意义。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照本发明实施例进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明的技术方案的精神和范围,其均应涵盖本发明的权利要求保护范围中。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种数据处理方法、装置、电子设备和存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!